1 INTRODUCTION

Table des matières

Bien avant l’avènement de la biologie moléculaire, la transmission du matériel génétique a été étudiée en suivant des traits physiques caractéristiques tels ceux décrits dans les travaux de Gregor Johann Mendel. Ce dernier a établi les lois de la ségrégation génétique (publiées en 1866 dans les Comptes Rendus de la Société des Sciences Naturelles de Brno ) permettant d’expliquer la transmission de caractères physiques et introduisant les concepts de dominance et de récessivité. Ces lois sont demeurées les fondements de la génétique moderne et expliquent la majorité des transmissions génétiques.

Cependant, en 1943, J. Martin et J. Bell ont identifié un désordre lié au chromosome X présentant une ségrégation non conforme aux lois de Mendel (Martin and Bell 1943). Ces chercheurs ont étudié deux générations d’une famille où se trouvaient onze individus atteints de retard mental qui présentaient des traits physiques communs. La maladie fut désignée sous le nom de syndrome de Martin-Bell jusqu’en 1969, année où Lubs observa chez les sujets atteints un site fragile à l’extrémité du bras long du chromosome X qu’il nomma FRAXA (FRAgile chromosome X site A) (Lubs 1969). Ce site fragile peut être visualisé sur les chromosomes en métaphase de mâles atteints de retard mental ainsi que chez les femmes porteuses obligatoires de la même famille. On conserva la notion de fragilité pour nommer le syndrome. Quelques années plus tard, Sutherland démontra que les sites fragiles s’induisaient dans des conditions de culture où l’acide folique où la thymidine était absents (Sutherland 1977). Le site fut localisé en Xq27.3 en 1985 (Krawczun et al. 1985).

Bien qu’il soit la première cause de retard mental héréditaire, le syndrome X-fragile demeure un désordre difficile à identifier car les personnes atteintes présentent une très grande variabilité phénotypique, y compris à l’intérieur d’une même famille. Le retard mental présent chez la majorité des garçons atteints est habituellement de modéré à profond mais certains patients présentant un retard léger ont aussi été observés.

Au niveau physique, les caractéristiques les plus courantes chez les mâles atteints sont la macroorchidie (augmentation du volume des testicules), les pieds plats, un faciès allongé, une mâchoire et des oreilles proéminentes (70 % des patients). On retrouve aussi une hyperlaxité des articulations (plus particulièrement celles des doigts), une voûte de palais arquée, des anomalies cardiaques et bien d’autres phénotypes plus rares (Hagerman et al. 1991; Hagerman 1996). Les caractéristiques physiques reliées au syndrome apparaissent au cours de l’enfance et s’accentuent après la puberté (tel le macroorchidisme). Ainsi, elles sont moins souvent utilisées pour le diagnostic de la maladie qui est habituellement posé avant la puberté car l’enfant atteint présentera un retard d’apprentissage et certains des comportements énumérés ci-dessous.

Au niveau comportemental, les personnes atteintes souffrent d’hyperactivité, de difficultés d’attention, de l’écholalie et des problèmes d’élocution (Hagerman et al. 1991; Hagerman 1996). On retrouve aussi certains comportements normalement associés à l’autisme tel le contact visuel fuyant, battement et morsure des mains, mais aucune corrélation n’a été trouvée entre l’autisme et le syndrome X-fragile (Fisch 1993).

Le syndrome affecte aussi les femmes mais de façon plus modérée car elles possèdent deux chromosomes X. L’un des deux chromosomes est inactivé de façon aléatoire et cette inactivation se traduit par l’abolition de l’expression de la majorité des gènes du chromosome. Le gène normal est donc exprimé dans des proportions variables de cellules réduisant ainsi la sévérité des phénotypes habituellement observés (Abrams et al. 1994; Reiss et al. 1995). De plus, une étude a démontré une inactivation préférentielle des allèles mutés dans les cellules sanguines de femmes adultes, suggérant un processus de sélection favorisant les allèles qui expriment le gène normal (Rousseau et al. 1991).

Les femmes présentent donc des phénotypes plus modérés que les hommes tant au niveau physique qu’intellectuel. Les caractéristiques physiques chez la femme sont rarement assez prononcées pour permettre de poser le diagnostic. On retrouve du retard mental chez 52 % à 82 % de ces femmes mais à un degré moindre que chez l’homme atteint. Les comportements ressemblant à l’autisme chez l’homme font place à de la dépression et des problèmes d’ordre sociaux chez la femme. Parmi les plus fréquents on retrouve de la gène, de l’anxiété sociale, une communication inadéquate, une baisse du contact visuel et le désordre d’hyperactivité de déficit d’attention. (Abrams et al. 1994; Reiss et al. 1995)

Compte tenu du caractère variable des phénotypes, les premières estimations de la prévalence du syndrome X-fragile furent basées sur la méthode cytogénétique de visualisation du site fragile. Cependant, cette méthode ne permettait pas d’identifier tous les porteurs de la mutation, et la présence d’un autre site fragile en Xq28 fut responsable d’une surestimation de la prévalence (Sutherland and Baker 1992). Depuis l’identification de la mutation responsable de la maladie, une estimation plus fiable a pu être produite et l’incidence est maintenant évaluée à 1 garçon atteint sur 4000 (Murray et al. 1996; Turner et al. 1996; Imbert et al. 1998). De cette incidence, celle des femmes atteintes peut être déduite à 1 sur 6500-8000.

Figure 1: Pedigree artificiel d’une famille où on retrouve le syndrome X-fragile .

Le pourcentage se retrouvant sous les symboles représente la fréquence de retard mental à chaque génération. D’après Nussbaum and Ledbetter (1986) Chaque membre du pedigree est identifié par le chiffre romain à la gauche.

Femmes et hommes (MNT) porteurs d’une prémutation Femmes et hommes atteints

Selon les publications, le syndrome X-fragile fut qualifié comme un désordre dominant ou récessif lié au chromosome X. En considérant que seulement une portion des femmes porteuses du gène muté sont affectées par un retard léger ou modéré, certains auteurs ont qualifié le désordre comme étant récessif par défaut. D’un autre côté, si le désordre était dominant, tous les hommes seraient atteints. Or, 20 % des hommes porteurs de la mutation sont phénotypiquement normaux (Sherman et al. 1984; Sherman et al. 1985).Ces porteurs sains sont nommés MNT (mâles normaux transmetteurs: Figure 1, individu V). Ainsi, le syndrome X-fragile peut être qualifié de dominant à pénétrance incomplète. Son mode de transmission est particulier car les MNT ont toujours des enfants sains mais leurs petits-enfants (nés de fille(s) de MNT (Figure 1, individus XIII et XIV)) auront un risque élevé d’être atteints du syndrome, un phénomène connu sous la dénomination de “Paradoxe de Sherman” (Sherman et al. 1984).

La lumière se fit sur le paradoxe de Sherman lors de la découverte du mécanisme mutationel inusité responsable de la maladie: une mutation dynamique. Ce type de mutation se caractérise par l’allongement d’une séquence répétée instable lors de sa transmission. L’expansion d’une répétition de trinucléotide CGG associée au syndrome X-fragile est le premier cas décrit de ce type de mutation (Kremer et al. 1991; Oberle et al. 1991; Verkerk et al. 1991; Vincent et al. 1991; Yu et al. 1991). Depuis la découverte des mutations dynamiques, plusieurs maladies y ont été associées telles l’ataxie de Friedreich (Campuzano et al. 1996), la maladie de Huntington (Huntington Disease Collaborative Research Group 1993), la dystrophie myotonique (Mahadevan et al. 1992; Brook et al. 1992), les ataxies spinocérébelleuses de type 1, 3, 6 et 7 (Koide et al. 1994; Kawaguchi et al. 1994; Zhuchenko et al. 1997; Lindblad et al. 1996) et les atrophies musculaire spinobulbaire (La Spada et al. 1991) et dentatorubrale-pallidoluysienne (Koide et al. 1994).

Les répétitions de CGG sont très polymorphiques dans la population générale et l’étude de leur structure a amené une catégorisation selon le nombre de triplets et leur stabilité.

A) La première catégorie d’allèles comprend les répétitions de longueur normale dont le nombre de triplet se situe entre 6 et 54. Les répétitions sont composées en moyenne de 29 ou 30 triplets selon les populations étudiées (Fu et al. 1991; Yu et al. 1991). La portion supérieure (40-54 triplets) de cette catégorie constitue une sous-division, une “zone grise” (intermédiaire) un peu moins stable qui pourrait bien être la source des prémutations.

B) Les allèles prémutés composent la seconde catégorie. Leurs répétitions sont faites de 55 à environ 200 triplets. La dénomination “prémutation” vient du fait que ces allèles précèdent l’apparition des mutations complètes. Elles ne provoquent aucun état pathologique chez l’homme mais une augmentation du nombre de ménopause précoce est observé chez les femmes porteuses (Schwartz et al. 1994; Turner et al. 1994; Murray et al. 1998; Allingham-Hawkins et al. 1999; Uzielli et al. 1999). Ce phénotype est toutefois absent chez les femmes atteintes du syndrome.

C) Finalement, on retrouve les mutations complètes qui sont des répétitions dont la longueur excède 200-230 triplets. L’expansion des prémutations en mutations complètes s’effectuent uniquement via la transmission maternelle. Ce qui caractérise particulièrement la mutation complète, hormis sa longueur, est la présence d’une hyperméthylation des répétitions elles-mêmes ainsi que de l’îlot CpG tous deux situés dans la région 5’ du gène FMR1 .

Cette méthylation fut d’abord détectée à la suite de la digestion de l’ADN de patients X-fragile à l’aide d’enzymes de restriction coupant rarement et inhibées par la méthylation (Bell et al. 1991; Heitz et al. 1991; Verkerk et al. 1991; Vincent et al. 1991; Hornstra et al. 1993). Ce sont d’ailleurs ces digestions qui permirent de mettre en évidence l’allongement de l’ADN associé au désordre. La méthylation s’effectuant dans une région régulatrice du gène FMR1 , il fut postulé qu’elle pourrait être responsable de l’inactivation du gène observée lors d’une étude d’expression de l’ARN messager chez des patients X-fragile (Pieretti et al. 1991). D’ailleurs, une corrélation inverse entre le taux de méthylation des répétitions et de l’îlot CpG et la production de la protéine FMR1 a été observée chez des patients ayant une mutation complète pas ou partiellement méthylée (Loesch et al. 1993; McConkie-Rosell et al. 1993; Hagerman et al. 1994; Rousseau et al. 1994b; Feng et al. 1995; Smeets et al. 1995; de Vries et al. 1996; Wang et al. 1996). Ces études suggèrent aussi que la sévérité du phénotype serait liée au taux de méthylation et que les différents patrons de méthylation pourraient expliquer la variabilité phénotypique observée.

Récemment, une équipe a démontré que la méthylation des îlots CpG entraînait la condensation de la chromatine à la suite de la déacétylation des histones 3 et 4 (Coffee et al. 1999). Cette condensation empêcherait les facteurs de transcription de se lier au promoteur du gène FMR1 (Drouin et al. 1997; Schwemmle et al. 1997) provoquant son inactivation. L’implication du gène FMR1 dans le syndrome X-fragile fut pleinement confirmée par l’identification de patients dont les phénotypes X-fragile étaient causés par une mutation ponctuelle (De Boulle et al. 1993; Lugenbeel et al. 1995; Wang et al. 1997) ou par une délétion partielle ou totale du gène FMR1 (Gedeon et al. 1992; Wohrle et al. 1992; Tarleton et al. 1993; Albright et al. 1994; Gu et al. 1994; Meijer et al. 1994; Trottier et al. 1994; Hirst et al. 1995; Prior et al. 1995; Quan et al. 1995; Gronskov et al. 1997; Hammond et al. 1997; Wolff et al. 1997).

Les répétitions de longueur normale sont généralement transmises de façon stable mais il arrive parfois que de légères instabilités soient observées (Zhong et al. 1996; Mogk et al. 1998 ; Sullivan et al. 2002)(Rousseau et al. résultats non-publiés). Ces instabilités sont des variations (expansions ou délétions) de quelques triplets qui sont sans conséquences. La zone grise a été identifiée comme telle parce qu’elle constitue une zone un peu plus instable. L’expansion d’un allèle de la zone normale en mutation complète n’a jamais été observée. Par contre, il est possible que les petites expansions conduisent éventuellement à la transformation des allèles normaux en allèle prémutés bien que cela n’aie pas été prouvé encore.

La frontière entre les allèles normaux et prémutés (55 triplets) est basée sur la probabilité d’expansion de la répétition en mutation complète. La frontière entre la prémutation et la mutation complète est l’apparition de la méthylation (≅ 200-230 triplets). Ces deux limites ne sont pas précises et sont basées sur les observations effectuées sur la stabilité des prémutations dans les familles où l’on retrouve le syndrome X-fragile. Lors de sa transmission, la prémutation est rarement stable et son potentiel d’expansion est directement proportionnel au nombre de triplets qui la compose (Fu et al. 1991; Heitz et al. 1992). Les personnes ayant une prémutation ont habituellement un nombre de triplets supérieur à celui du parent transmetteur augmentant ainsi les chances, pour les femmes, de transmettre une mutation complète à la génération suivante (Figure 1 p.5, individus IV, VIII et XII (femmes) et individus II, VI et XI (hommes)). Ce phénomène est similaire à l’anticipation génétique où la sévérité d’un désordre s’accentue dans les générations subséquentes, une situation classique pour les maladies à triplets. Cependant, les hommes prémutés (Fig. 1, individu V) ou atteints du syndrome ne transmettent jamais une mutation complète (Willems et al. 1992; Rousseau et al. 1994b) car il semblerait y avoir un processus de sélection durant la spermatogénèse en faveur des spermatozoïdes ayant une prémutation, donc produisant la protéine (Hori et al. 1993; Reyniers et al. 1993).

Compte tenu que les femmes sont moins affectées que les hommes par le syndrome, il arrive que l’on observe la transmission de mutations complètes. Celles-ci sont instables lors de leur transmission et contrairement aux autres types d’allèles, sont aussi instables au niveau somatique (qu’elles proviennent de la transmission d’une prémutation ou d’une mutation complète). Cette instabilité serait limitée au début du développement embryonnaire, avant la méthylation des répétititons. Plusieurs croient d’ailleurs que la méthylation sert à stabiliser l’expansion des mutations complètes. L’instabilité somatique se présente sous la forme de mosaïcisme de taille chez les patients atteints du syndrome, c’est-à-dire la coexistence de mutations complètes méthylées et de répétitions plus courtes non-méthylées. Les études démontrent que 15 à 40 % des porteurs de mutations complètes sont des mosaïques de taille (Devys et al. 1992; Heitz et al. 1992; Snow et al. 1993; Kaplan et al. 1994; Nolin et al. 1994; von Koskull et al. 1994), un certain nombre de leur cellules ayant soit une prémutation (Nolin et al. 1994; Pintado et al. 1995) ou un allèle de longueur normale (Snow et al. 1993; de Graaff et al. 1995; Hirst et al. 1995; Mila et al. 1996). Dans les cellules porteuses de ces répétitions plus courtes, le gène est exprimé et la protéine est produite normalement, ce qui pourrait expliquer une partie de la variabilité phénotypique. On retrouve aussi des mosaïques de méthylation, des patients dont les mutations sont partiellement méthylées ou pas du tout. La proportion de mutations non-méthylées varie de 10 à 100 % et les individus ayant plus de 60 % de leur mutation non-méthylées présentent en général une intelligence normale (McConkie-Rosell et al. 1993; Reyniers et al. 1993: Loesch et al. 1993; Hagerman et al. 1994; Rousseau et al. 1994b; Feng et al. 1995; Smeets et al. 1995; de Vries et al. 1996; Wang et al. 1996). Les différents patrons de méthylation pourraient aussi expliquer une partie de la variabilité phénotypique observée.

La séquence répétée dont l’expansion est associée au syndrome X-fragile se trouve dans la région 5’ non-traduite de l’exon 1 du gène FMR1 (Fragile X Mental Retardation 1). Le gène fut localisé en 1991 (Verkerk et al. 1991) juste après la mutation dynamique. L’étude de sa structure révéla qu’il est composé de 17 exons répartis sur 38 kb (Eichler et al. 1993; Eichler et al. 1994).

Chez l’humain, le transcrit primaire du gène normal a une longueur observée de 4.4 kb en hybridation Northern alors que théoriquement il devrait avoir 3.9 kb, soit une région 5’ non-traduite d’environ 200 pb (varie selon le nombre de triplets), une région codante de 1.9 kb et une région 3’ non-traduite de 1.8 kb (Verkerk et al. 1991; Eichler et al. 1993) mais cette différence n’a pu être expliquée. Le transcrit primaire peut subir un épissage alternatif important et des études par RT-PCR ont démontré la présence de transcrits dont les exons 12 et 14 étaient épissés (Ashley et al. 1993b; Verkerk et al. 1993a; Verkerk et al. 1993b). De plus, l’étude de la séquence nucléotidique a permis d’identifier des sites accepteurs d’épissage alternatif supplémentaires dans les exons 10 (Eichler et al. 1993), 15 et 17 (Ashley et al. 1993b; Eichler et al. 1993; Verkerk et al. 1993b; Sittler et al. 1996). Ainsi, le nombre d’ARNs messagers distincts possibles s’élève jusqu’à 48! Vingt-quatre de ces messagers ont été caractérisés par RT-PCR mais rien ne prouve qu’ils soient traduits en protéines. L’épissage de l’exon 12 et les différents sites accepteurs ne modifient pas la séquence en acides aminés contrairement à l’épissage de l’exon 14 qui génère une nouvelle extrémité carboxy-terminale (Ashley et al. 1993b; Sittler et al. 1996). L’abondance des différents messagers, analysée par RT-PCR, varie selon les tissus observés mais aucun n’est spécifique à un tissu particulier (Verkerk et al. 1993b).

L’expression du messager du gène FMR1/Fmr1 (4.4 kb) a été étudiée par hybridation Northern et in situ afin d’identifier quels tissus et structures exprimaient le gène. Ces études ont aussi permis de faire des liens entre l’absence d’expression du gène et les différents phénotypes observés chez les patients X-fragile. Ces études ont été effectuées sur des tissus d’embryons humains et sur des souris (foetus et adulte) dont la protéine Fmr1 présente une très grande homologie de séquence à l’orthologue humain.

Une étude par hybridation in situ a été effectuée sur des coupes d’embryons humains agés de 8, 9 et 25 semaines par Abitbol et al (1993). Les structures exprimant le messager dans le système nerveux central (SNC) sont impliquées dans les processus de motivation, d’apprentissage et de la mémoire (tel le noyau basal magnocellulaire). Ces résultats pourraient expliquer certaines phénotypes de retard mental observés chez les patients.

En général, les résultats obtenus suggèrent que FMR1 pourrait jouer un rôle majeur dans le développement compte tenu de la nature quasi-ubiquiste de l’expression du gène durant cette période (Abitbol et al. 1993; Hanzlik et al. 1993). Le fait que le messager soit exprimé dans les cellules en prolifération et en migration du SNC confère un rôle crucial au gène FMR1 pour les derniers stades de développement du SNC (migration et maturation cellulaire).

Chez la souris, les mêmes types de résultats ont été obtenus par Hinds et al (1993). Les auteurs mentionnent que dans certains tissus tel le cerveau, le gène n’est plus exprimé partout vers la fin du développement mais devient restreint à certaines cellules. L’expression perd son caractère ubiquiste pour devenir plus spécifique. Fait intéressant, après 14 et 19 jours de gestation, le muscle cardiaque exprime clairement Fmr1 alors que dans le coeur adulte, celui-ci est absent. On peut émettre l’hypothèse que ce soit en lien avec le développement incomplet du coeur et que dans les stades ultimes de la myogénèse, la protéine Fmr1 cesse d’être exprimée pour laisser place aux superformes de l’homologue Fxr1 comme il a été démontré dans les cellules de muscles squelettiques C2C4 (Khandjian et al. 1998). Cela pourrait expliquer les problèmes cardiaques de certains patients X-fragile. Les niveaux d’expression relatifs du gène Fmr1 dans les différents tissus sont compilés dans le tableau 1 à la page suivante.

Deux études réalisées par Bachner et al (1993a, 1993b) portant sur l’expression du gène dans les gonades lors du développement montrent que le gène Fmr1 est exprimé de façon marquée dans les testicules et les ovaires. Dans les testicules immatures de souris agées d’une semaine, l’expression du gène est homogène dans tous les tubules. Le signal devient plus hétérogène avec les semaines suivantes pour devenir restreint à la périphérie des tubules où se trouvent les spermatogonies de type A1 (3e semaine). Cette expression continue de diminuer au cours des semaines subséquentes pour ne devenir qu’un faible signal vers la 17e semaine. Ceci correspond à l’activité proliférative des spermatogonies de type A1, progénitrices de tous les autres types de spermatogonies nécessaires à la spermatogénèse (Bachner et al. 1993a; Bachner et al. 1993b). Dans les testicules, les auteurs rapportent des niveaux d’expression de Fmr1 30-40 fois plus élevés que dans les autres tissus étudiés et suggèrent que la forte expression du gène pourrait expliquer le processus de sélection à l’origine de la présence de prémutations dans le sperme de patients X-fragile.

La recherche de séquences homologues au gène FMR1 dans des banques d’ADNc de cerveau foetal humain et murin a conduit à la découverte du gène FXR1 (Fragile X Related 1), cartographié sur la région chromosomique 3q28 chez l’homme (Coy et al. 1995) ainsi q’une forme sans introns de ce gène (pseudogène) en 12q12 (Coy et al. 1995; Siomi et al. 1995). Un orthologue du gène FXR1 a aussi été identifié chez Xenopus laevis (Siomi et al. 1995). Aussi, une protéine homologue interagissant avec la protéine FMR1 a été identifiée avec le système double-hybride de la levure. Cette protéine est codée par le gène FXR2 qui est localisé sur le chromosome 17 humain en position 17p13.1 (Zhang et al. 1995; Wilgenbus et al. 1996) et son orthologue a été caractérisé chez la souris. Aucun orthologue de ces deux protéines n’a été identifié chez la drosophile, suggérant que le gène dFMR1 serait l’ancêtre commun des trois membres de cette nouvelle famille de protéines chez les organismes plus complexes.

La traduction de la séquence codante de FMR1 donne une protéine de 632 acides aminés ayant un poids moléculaire théorique de 69 kDa (Ashley et al. 1993b). L’outil de choix pour l’étude des protéines est l’anticorps qui permet leur visualisation in situ , dans des extraits protéiques par immunobuvardage ou tout simplement leur immunoprécipitation avec leurs partenaires cellulaires lorsque cela est possible. Les anticorps sont habituellement produits sous forme monoclonale à partir de la rate de souris immunisées (et parfois de rats), ou sous forme polyclonale dans le sérum de lapins.

Dans le cas de la protéine FMR1, la tâche n’a pas été aisée car la séquence protéique est extrèmement bien conservée parmi les mammifères. Chez le lapin, on obtient un mélange d’anticorps ayant des affinités pour différentes portions de la protéine ce qui augmente les chances de réussite. Par contre, chez la souris, l’obtention de monoclonaux est plus délicate. La souris possède une protéine Fmr1 dont l’homologie atteint 97 % avec l’orthologue humain, la souris ne produira donc pas des anticorps de forte affinité qui pourraient créer une réaction autoimmune. De plus, les protéines homologues FXR1 et FXR2 présentent aussi une bonne homologie de séquences avec la protéine FMR1, augmentant les chances de réactions croisées. Malgré ces obstacles, deux équipes ont réussi à produire des anticorps polyclonaux (Verheij et al. 1993; Verheij et al. 1995) et monoclonaux (Devys et al. 1993).

L’utilisation de ces anticorps en immunobuvardage permet de détecter un ensemble de 6 protéines dont les poids moléculaires se situent entre 70 et 80 kDa. De plus, l’immunobuvardage d’un gel en 2 dimensions effectué par Khandjian et al. (1995) a révélé que 10 isoformes distinctes se dissimulaient dans les 6 bandes observées précédemment. Il est plausible que les nombreuses isoformes observées soient produites à la suite de l’épissage alternatif mentionné antérieurement. Une tentative d’identification des isoformes a été effectuée à l’aide de constructions permettant la production de protéines tronquées (Sittler et al. 1996). L’expérience consistait à mimer l’épissage alternatif déduit de la séquence nucléotidique du gène puis à comparer les protéines tronquées aux isoformes endogènes par immunobuvardage. Cependant, les résulats ne permettent pas de tirer de conclusions puisqu’il est possible que les formes endogènes aient subies des modifications post-traductionnelles telles la glycosylation et/ou la phosphorylation. Ainsi, le poids moléculaire apparent des protéines endogènes n’est pas uniquement fonction de la séquence protéique. Il est donc impossible de conclure que les protéines FMR1 produites dans les bactéries et les protéines endogènes possèdent la même séquence protéique en se basant uniquement sur le fait qu’elles présentent un poids moléculaire apparent identique.

Certains auteurs ont aussi émis l’hypothèse qu’un regroupement de résidus acides retrouvé dans la séquence pourrait ralentir la mobilité de la protéine lors de sa migration dans un gel d’acrylamide, lui donnant un poids moléculaire apparent plus élevé que celui attendu (Siomi et al. 1993b).

L’absence de ces protéines dans des extraits de lymphocytes immortalisés de patients X-fragile confirma que les protéines observées étaient bien issues du gène FMR1 puisqu’elles étaient présentes dans les lignées de lymphocytes normaux (Devys et al. 1993; Verheij et al. 1993).

L’étude de l’expression du messager du gène FMR1 a démontré une implication directe avec les phénotypes retrouvés chez les patients X-fragile mais n’a pas éclairé la communauté scientifique sur son rôle dans la cellule. Les différents motifs identifiés dans la séquence protéique, sont les premiers indices obtenus quant à la fonction de la protéine même si son caractère quasi-ubiquiste suggérait déjà un rôle de base. La recherche de séquences consensus réalisée sur la protéine a permis d’identifier des domaines de liaison à l’ARN (Siomi et al. 1993b; Brown et al. 1998), un signal d’exportation cytoplasmique et une séquence de localisation nucléaire (Eberhart et al. 1996). La position des domaines fonctionnels ainsi que les exons par lesquels ils sont codés sont schématisés dans la figure 2 à la page suivante.

Les domaines KH (K Homology) ont été identifiés pour la première fois sur la protéine hnRNP K, une protéine liant l’ARN messager au niveau du noyau et impliqué dans son transport et sa maturation (Siomi et al. 1993a). La protéine FMR1 possède deux domaines KH situés au coeur de sa séquence protéique. (KH1 = a.a. 212-266 KH2 = a.a. 285-328) L’importance fonctionnelle des domaines KH fut confirmée par l’identification d’une mutation ponctuelle dans le KH2 changeant une isoleucine très conservée par une asparagine (I304N) causant un phénotype X-fragile très sévère (De Boulle et al. 1993). L’étude tridimensionnelle de ce domaine KH muté par résonnance magnétique nucléaire (RMN) a révélé qu’il ne se repliait pas correctement (Musco et al. 1996) entraînant une détérioration de sa capacité de liaison in vitro à des homopolymères d’ARN en présence de hautes concentrations de sel (Siomi et al. 1994; Verheij et al. 1995). Cependant, une autre étude a démontré que dans des conditions salines physiologiques, la protéine mutée conserve une bonne capacité de liaison à l’ARN (Brown et al. 1998). Il semblerait plutôt que la mutation nuise à l’interaction protéine-protéine lui permettant de s’associer aux polysomes [Feng et al. 1997].

Récemment, Adinofi et al (1999) ont disséqué les différents domaines de la protéine FMR1 afin d’identifier quelles portions pouvaient lier des homopolymères d’ARN. La protéine a été disséquée en portion N-terminale (Figure 2, fragment 1), plus le domaine KH1 (fragment 2), les domaines KH1 (fragment 3) et KH2 (fragment 4) seuls, les deux ensembles (fragment 5), le domaine KH2 plus l’exon 14 (fragment 6) et finalement la portion C-terminale comprenant les trois derniers exons (fragment 7).

Figure 2: Représentation schématique des domaines fonctionnels de la protéine FMR1 par rapport aux exons les codant.

Les barres horizontales sous les exons représentent les fragments générés par Adinolfi et al. (1999 ) pour l’étude de la liaison à l’ARN par les différents domaines de la protéine FMR1. a.a.: acides aminés, N: bout amino-terminal, NLS: Signal de localisation nucléaire, KH : K Homology, NES: Signal d’exportation cytoplasmique, RGG: Boîte RGG et C: bout carboxy-terminal.

Les résultats obtenus sont très surprenants puisque la seule portion de la protéine ne liant pas l’ARN est le second domaine KH. Les études par spectroscopie RMN ont démontré que ce domaine ne se repliait pas correctement et c’est pourquoi les auteurs ont vérifié:

1) une construction contenant le domaine KH2 et la séquence en aval comprenant l’exon 14

2) une construction comprenant les deux domaines KH.

Dans le premier cas, le peptide n’était pas du tout replié alors que dans l’autre seul le domaine KH1 était replié correctement. Les auteurs concluent donc que le domaine KH2 ne se comporte pas comme une entité se repliant indépendamment mais aurait besoin d’autres structures pour adopter un arrangement tridimensionnel lui permettant d’exercer sa fonction. De manière surprenante, la portion N-terminale démontre une affinité pour les homopolymères d’ARN malgré l’absence de séquence consensus de liaison à l’ARN. Elle aurait aussi une tendance à former des aggrégats ce qui confirmerait les observations faites par Siomi et al qui rapportent l’homodimérisation de la protéine FMR1 via une portion de 40 acides aminés situés entre les résidus 171 et 211 (Siomi et al. 1996). Finalement, la portion C-terminale de la protéine est aussi en mesure de lier l’ARN et cette liaison serait médiée par la boîte RGG discutée dans la section suivante.

Alors qu’ils étudiaient les différentes isoformes possiblement traduites à la suite de l’épissage alternatif, Sittler et al (1996) ont remarqué que la protéine FMR1 sans l’exon 14 se retrouvait dans le noyau tandis que la forme complète se retrouvait majoritairement dans le cytoplasme (Devys et al. 1993). Cette divergence s’explique par la présence d’un signal d’exportation cytoplasmique (NES: Nuclear Export Signal) dans l’exon 14 (Eberhart et al. 1996). Différentes constructions avec des formes tronquées de l’exon 14 permirent d’identifier les 17 premiers acides aminés de cet exon comme étant nécessaires et suffisants à l’exportation cytoplasmique de la protéine FMR1. L’étude de la séquence (Fridell et al. 1996) révéla une forte similitude avec le NES des protéines Rev (Fischer et al. 1995) et PKI (Wen et al. 1995) spécialement au niveau de 3 leucines très conservées. Bardoni et al (1997)ont démontré l’importance de ces leucines en les remplaçant par des sérines, ce qui abolissait l’exportation et résultait en une localisation nucléaire de la protéine.

Cette localisation nucléaire des protéines FMR1 sans l’exon 14 ou ayant un NES muté suggérait fortement la présence d’un signal de localisation nucléaire (NLS: Nuclear Localisation Signal). Toutefois, les études portant sur la séquence protéique ne révélèrent aucune séquence consensus de NLS. Des groupes de résidus arginine et lysine sont présents dans les 184 premiers acides aminés de FMR1 et ces acides aminés basiques (24 en tout) sont aussi conservés chez la souris, le poulet et Xenopus laevis (Ashley et al. 1993b; Siomi et al. 1995; Price et al. 1996) et pourraient constituer un nouveau type de NLS. Des études de transfection ont restreint la zone du NLS potentiel aux résidus 115 à 150 comme étant suffisant pour confiner une protéine dans le noyau (Eberhart et al. 1996; Bardoni et al. 1997). Les auteurs mentionnent cependant que les séquences entourant cette région pourraient servir à renforcer l’activité de localisation nucléaire.

L’utilisation du système double-hybride dans la levure a permis de mettre en évidence pour la première fois une protéine interagissant avec la protéine FMR1 (Zhang et al. 1995). Cette protéine est l’homologue FXR2 et cette étude démontra aussi que la protéine FMR1 ainsi que ses homologues FXR1 et FXR2 (discutés dans la section suivante) peuvent s’hétérodimériser ainsi que s’homodimériser. Afin d’identifier la région responsable de cette association, Siomi et al (1996)ont préparé des constructions dont certaines régions des portions amino et carboxy-terminale de FMR1 étaient délétées puis ont vérifié leur association avec FXR2 in vitro . La région située entre les acides aminés 171 et 211 de la protéine FMR1 est suffisante pour son interaction avec FXR2 et les régions correspondantes sur FXR1 et FXR2 leur permettent de s’associer avec FMR1. Cette région est une séquence codée par l’exon 7, suggérant que l’interaction entre ces protéines ne nécessite pas la liaison à l’ARN. De plus, Adinolfi et al (1999) ont remarqué qu’un peptide comprenant la portion amino-terminale de la protéine FMR1 (a.a. 1-204) formait des aggrégats in vitro appuyant l’observation précédente.

La même année, Tamanini et al (1999) ont observé l’interaction de ces protéines entre elles in vivo lors de la surexpression de l’une de ces trois protéines dans des cellules COS. Ils ont aussi montré que l’interaction de la forme transfectée de FMR1 sans l’exon 14 avec les protéines FXR1 et FXR2 endogènes est suffisante pour la rapatrier dans le cytoplasme. Cependant, les résultats obtenus dans les homogénats de cellules HeLa et de lignées lymphoblastoïdes suggèrent que les hétérodimères n’existent peut-être pas in vivo et que l’interaction observée in vitro et in vivo dans les cellules surexprimant les protéines résulterait uniquement de la présence d’un domaine coil-coil (a.a. 171-211) similaire sur les trois protéines. Ce type de domaine régit les interactions protéine-protéine et il est possible que la similarité de ces domaines soit suffisante pour qu’ils interagissent entre eux lorsqu’ils sont en excès. La protéine mutée (I304N) est en mesure de s’hétérodimériser avec les homologues mais il est intéressant de noter qu’elle est incapable de s’homodimériser (Laggerbauer et al. 2001). Il est plausible que la dimérisation de FMR1 soit nécessaire à sa fonction ou à son incorporation dans les polysomes.

L’expression tissulaire de la protéine FMR1 a été principalement étudiée grâce à l’anticorps monoclonal 1C3 (autrefois appelé mAb 1a) produit par Devys et al (1993) et aux anticorps polyclonaux de Verheij et al (1993). Devys et al ont préparé différentes constructions comprenant la portion amino-terminale ou la séquence complète de la protéine FMR1 dans des vecteurs eucaryotes et procaryotes. Des corps d’inclusion comprenant la forme complète ou la portion N-terminale purifiée ont été injectés à des souris Balb C et des lapins. Deux anticorps polyclonaux et 4 monoclonaux furent obtenus et leur spécificité vérifiée par immunobuvardage. Le meilleur anticorps, 1a, a ensuite été utilisé pour étudier l’expression de la protéine FMR1 sur des tissus humains.

Dans le cerveau, la protéine est exprimée dans les neurones du cortex ainsi que dans le cervelet au niveau des cellules de Purkinje. Dans les axones, FMR1 se retrouve dans la portion proximale et les dendrites. Dans tous les tissus épithéliaux examinés, les auteurs ont observé une expression décroissante de la couche de cellules en division active vers les cellules plus différenciées. Ce gradient a aussi été constaté dans l’oesophage, l’estomac et le petit intestin. Dans les testicules, la protéine est exprimée dans les spermatogonies de type A1 alors que les cellules plus matures ne l’expriment pas. Finalement, la protéine FMR1 est absente du coeur, des muscles squelettiques et des muscles lisses.

Fait intéressant à noter, suite à une blessure, la protéine est produite dans des tissus en réparation qui normalement ne produisent pas FMR1 chez l’adulte. La protéine recommence aussi à être exprimée dans des cellules de rein dont la prolifération est induite suite à leur infection par le virus SV40 (Khandjian et al. 1995). Au niveau intracellulaire, la protéine est exprimée dans le cytoplasme des cellules en culture (HeLa) ou de celles des tissus étudiés (neurones, cellules de Purkinje et spermatogonies)(Devys et al. 1993).

L’anticorps monoclonal 1C3 a aussi été utilisé par Khandjian et al. (1995) pour étudier la distribution de la protéine FMR1 dans l’organisme murin. Cette étude a été effectuée par immunobuvardage sur des homogénats de différents organes. En bref, les mêmes cellules des tissus mentionnés précédemment chez l’humain expriment la protéine Fmr1. Cependant, dans le coeur et les muscles squelettiques, deux formes ayant un mobilité réduite ont été détectées. Ces deux protéines furent identifiées par la suite comme étant des superformes de la protéine Fxr1 exprimées dans le muscle et les spermatocytes et produisant une réaction croisée avec l’anticorps 1C3 (Khandjian et al. 1998).

L’expression chez la souris a aussi été étudiée par immunohistochimie. Au cours du développement, l’expression de Fmr1 débute deux jours après la conception (stade 8 cellules). Après 9 jours la majorité des cellules de l’embryon expriment la protéine dans leur cytoplasme. Cette expression atteint son apogée chez les embryons ayant entre 11 et 13 jours pour ensuite décroître et devenir plus spécifique. Finalement, chez les embryons ayant entre 15 et 19 jours, l’expression reste élevée uniquement dans les neurones et les gonades (de Diego Otero et al. 2000). Chez la souris adulte, le patron d’expression ressemble à celui observé chez l’humain dans les neurones au niveau des dendrites et dans les cellules de Purkinje. Au niveau des gonades, la protéine Fmr1 est exprimée dans le cytoplasme des ovules et des spermatogonies (Bakker et al. 2000; de Diego Otero et al. 2000). La protéine est absente du muscle squelettique selon les résultats de Khandjian et al. (1998). Cependant, c’est dans cette étude qu’ils démontraient que l’anticorps détecte les superformes de la protéine Fxr1 et cette réaction croisée a peut-être empêché la visualisation des rares protéines Fmr1.

A priori , l’identification de domaines de liaison à l’ARN sur la protéine FMR1 et sa capacité à lier des homopolymères d’ARN et des ARNm (dont son propre messager) suggèrent qu’elle pourrait être impliquée dans le métabolisme de l’ARN. De plus, la protéine possède un signal d’exportation cytoplasmique et une activité de localisation nucléaire retrouvés sur des protéines naviguant entre le noyau et le cytoplasme. Elle pourrait bien être impliquée dans le transport d’ARNm du noyau vers la machinerie de traduction. En effet, la protéine FMR1 est associée avec les polyribosomes en traduction active (Corbin et al. 1997; Feng et al. 1997) mais jamais avec les ribosomes seuls contrairement à ce que le laissaient croire les premières études de fractionnement sur gradient de sucrose (Khandjian et al. 1996; Siomi et al. 1996; Tamanini et al. 1996).

Le traitement des polyribosomes avec de la RNAse démontra que l’association de la protéine FMR1 aux polyribosomes se faisait via une interaction avec l’ARNm ou avec une protéine liant l’ARN (Siomi et al. 1996; Tamanini et al. 1996). Cette association fut confirmée en traitant les polyribosomes avec de l’EDTA. Ce produit a pour effet de dissocier les ribosomes en sous-unités, relâchant ainsi les mRNPs (Particules RiboNucléiques Messagères) associées. Les complexes dissociés furent ensuite incubés en présence d’une matrice d’oligo d(T)-cellulose, poly(U)-sépharose ou latex-oligo d(T). La protéine FMR1, relâchée dans une mRNP de plus de 600 kDa, se retrouva dans les fractions liées aux différentes matrices démontrant qu’elle, ou ses partenaires, liait l’ARNm poly (A)+ (Corbin et al. 1997; Feng et al. 1997). Aussi, lorsque les cellules en culture sont soumises à des conditions minimales de survie, toutes les protéines FMR1 détectables sont associées avec les polyribosomes. C’est une preuve in vivo compatible avec la possibilité que FMR1 soit un gène domestique tel que suggéré par Heitz et al (1991) et fortement appuyée par l’expression quasi-ubiquiste de la protéine. Finalement, la forme mutante (I304N) est incapable de s’incorporer aux polyribosomes démontrant l’importance de l’intégration de FMR1 dans les mRNPs pour qu’elle exerce son rôle.

L’association de la protéine FMR1 avec les polyribosomes suggère qu’elle pourrait avoir un rôle à jouer dans la régulation de la traduction de certains ARNm. Effectivement, il a été montré que la protéine Fmr1 se trouvait dans les préparations de réticulocytes de lapin permettant de traduire des séquences nucléotidiques en peptides in vitro et que les protéines FMR1 ajoutées aux réticulocytes se trouvaient incorporées dans les mRNPs du système (Tamanini et al. 1996). Or, Li et al (2001) ont constaté que l’ajout en excès de FMR1 dans un tel système provoquait une inhibition de la traduction de certains ARNm spécifiques. Plus encore, cette inhibition est effective uniquement avec les messagers pouvant s’associer avec la protéine FMR1 in vitro. La délétion des extrémités 3’ non-traduites, où se lie la protéine, est suffisante pour lever cette inhibition. La stabilité des ARNm n’étant pas affectée, il semble que la simple liaison de FMR1 soit à l’origine de l’inhibition.

Laggerbauer et al (2001) ont aussi observé les mêmes résultats mais ont poussé plus loin leurs investigations. Premièrement, selon eux, l’inhibition de la traduction ne serait pas due à une séquence spécifique sur le messager. En second lieu, l’inhibition est vraiment une caractéristique intrinsèque de la protéine FMR1 puisque d’autres protéines possèdant des domaines KH et liant l’ARN n’ont pas cet effet. Troisièmement, la protéine mutante (I304N) n’exerce pas d’effet inhibiteur suggèrant que l’incorporation dans les polyribosomes serait nécessaire à l’inhibition de la traduction. Quatrièmement, les auteurs ont vérifié cette inhibition ex vivo en injectant la protéine et ses ARNm cibles dans des oocytes de Xenopus laevis. Encore une fois, ils ont constaté une baisse remarquable de la traduction de ces messagers qui n’est pas observée avec la protéine mutante.

Selon les données recueillies, la présence de la protéine FMR1 interfèrerait avec l’initiation de la traduction en empêchant l’assemblage du complexe ribosomal 80S (Laggerbauer et al. 2001). Il est toutefois improbable que ce soit le cas dans un contexte cellulaire normal puisque la protéine se retrouve associée aux polyribosomes en traduction active où l’on retrouve de multiples unités 80S. La protéine FMR1 pourrait aussi servir de séquestrateur d’ARNm dans l’attente d’un signal pour leur transport jusqu’à la machinerie de traduction. Il ne faut cependant pas exclure certains types cellulaires (tel les neurones) où la protéine FMR1 pourrait être en excès ce qui entrainerait une inhibition subséquente de la traduction de messagers spécifiques, dont le sien, créant une boucle de rétroaction négative.

Un des outils puissants de la biologie moléculaire pour l’étude de la fonction d’un gène consiste à utiliser un modèle animal chez lequel le gène à l’étude est inactivé (knock-out). Le mammifère le plus couramment utilisé est la souris et ce modèle convient parfaitement au syndrome X-fragile car la séquence protéique murine est identique à 97 % à celle humaine.

La souris “knock-out” pour le gène Fmr1 a été produite en 1994 par un consortium de chercheurs belges et hollandais. L’insertion d’une cassette néomycine par recombinaison homologue dans l’exon 5 du gène Fmr1 , empêchant l’expression de la protéine intégrale, a permis de recréer les phénotypes observés chez les patients X-fragile (Consortium 1994). Le dysmorphisme facial n’est pas remarquable mais la macroorchidie est évidente chez les souris k-o mâles adultes. Au niveau comportemental, les souris démontrent de l’hyperactivité et des difficultés d’apprentissage.

À l’origine, des tests permirent de démontrer un certain retard mental chez ces souris (mémoire spatiale), confirmé par la suite par d’autres équipes (D'Hooge et al. 1997: Kooy et al. 1996). Cependant, les résultats furent contestés sur la base du profil génétique par Paradee et al (1999) qui croisèrent la souris knock-out originale (profil 129) à une souris de profil C57BL/6 pendant plus de 15 générations. Ils observèrent que les souris k-o issues de ces croisements performaient presque normalement aux tests utilisés avec la souris k-o originale. Cette observation a été aussi faite par Dobkin et al (2000) mais sur des tests différents et suggère que ces tests ne sont pas parfaitement au point pour évaluer et comparer l’intelligence des souris X-fragile.

Malgré tout, ces modèles animaux ont permis de comprendre certains aspects physiologiques du syndrome X-fragile. Tout d’abord, il a été démontré que les épines dendritiques des souris k-o étaient anormalement longues, minces et tortueuses (Comery et al. 1997), des caractéristiques d’épines immatures observées précédemment sur les cadavres de patients X-fragile (Rudelli et al. 1985; Hinton et al. 1991). Une équipe s’est aussi attardée sur l’origine de la macroorchidie et celle-ci est causée par une augmentation de la prolifération des cellules de Sertoli lors du développement des testicules (Slegtenhorst-Eegdeman et al. 1998). Fait intéressant à mentionner, une équipe a corrigé le phénotype X-fragile en créant des souris knock-out ayant un YAC (Yeast Artificial Chromosome) produisant 10 à 15 fois plus de protéines Fmr1 que le gène sauvage. Ces souris transgéniques avaient des testicules de taille normale et performaient très bien aux tests d’intelligence utilisés (Peier et al. 2000). Ces souris présentaient malgré tout des comportements anormaux différents de ceux observés chez la souris k-o telle de l’hypoactivité et un haut niveau d’anxiété.

Des souris k-o ont aussi été créées pour les protéines homologues discutées dans la section suivante. Aucune publication n’est parue sur la souris k-o Fxr1 , celle-ci meurt peu de temps après sa naissance à la suite de problèmes pulmonaires et cardiaques. Récemment, une équipe a publié des résultats sur la souris k-o Fxr2 . Cette souris présente un retard mental et des phénotypes comportementaux ressemblant à ceux observés chez la souris k-o Fmr1 mais aussi certains phénotypes qui lui sont propres. Toutefois, au niveau des structures du cerveau et des testicules, il n’y a pas de différences entre la souris sauvage et la knock-out (Bontekoe et al. 2002).

Les protéines produites par les gènes FXR1 et FXR2 sont très similaires à la protéine FMR1. Elles présentent les mêmes domaines fonctionnels et ces régions sont les plus conservées entre les membres de la famille, ainsi qu’avec leur orthologues. On retrouve 92 et 97 % d’identité respectivement entre les acides aminés des domaines KH1 et KH2 des trois protéines, et l’espacement entre ces deux domaines est conservé. Le NES et les séquences l’entourant sont identiques à 86 %. Les 200 premiers acides aminés contenant l’activité de localisation nucléaire présentent 70 % d’identité. La portion carboxy-terminale est celle démontrant le plus de divergence (6 % de similitude) mais on retrouve aussi une boîte RGG dans les deux homologues.(Figure 3) La conservation de la séquence protéique de FXR1 entre les espèces est encore plus frappante. On retrouve 97.7 % d’homologie et 96.7 % d’identité entre les séquences humaine et murine. Par exemple, la séquence en acides aminés est totalement conservée entre les domaines KH de la souris et de l’humain.

Figure 3: Comparaison des séquences protéiques entre les protéines FMR1, FXR1 et FXR2.

Les barres horizontales représentent les acides aminé identiques dans les 3 protéines. Les barres verticales ou les vides représentent les acides aminés divergents ou absents dans les protéines homologues par comparaison avec la protéine FMR1. Les domaines fonctionnels sont inscrits à la gauche de la figure et à la droite de chaque protéine est indiqué la région reconnue par les différents anticorps. (Tiré de Khandjian et al. 1999)

L’expression des homologues Fxr1 et Fxr2 a été étudiée grâce à des anticorps spécifiques dirigés contre la portion C-terminale qui est la moins conservée (Fig. 3) (Tamanini et al. 1997; Khandjian et al. 1998). En immunobuvardage, deux isoformes FXR1 de 70 et 78 kDa sont détectées dans la plupart des tissus, ainsi qu’une protéine FXR2 de 94 kDa et une isoforme mineure de 86 kDa. Tout comme FMR1, les deux protéines homologues sont exprimées dans le cytoplasme des neurones du cortex, dans la portion proximale des dendrites et le périkaryon. Dans les axones, cette distribution concorde avec celle des ribosomes (Steward and Levy 1982). Dans le cervelet humain, l’expression des deux homologues se limite au cytoplasme des cellules de Purkinje.

Dans les testicules, la protéine FXR1 est exprimée principalement dans les cellules plus matures vers le centre des tubules séminifères alors que la protéine FXR2 est présente dans le cytoplasme de toutes les cellules du tubule. L’expression de FMR1 est différente car elle n’est produite que dans les spermatogonies à la périphérie des tubules. Ceci suggère que les trois protéines, quoique similaires, exercent certaines fonctions indépendantes dans la maturation des spermatozoïdes.

Dans le muscle squelettique, l’anticorps 1C3 détecte deux protéines ayant une mobilité réduite. Ces deux protéines sont en fait des superformes de la protéines FXR1, exprimées dans les muscles et les spermatocytes, et résultant d’une insertion de 81 paires de base (Khandjian et al. 1995; Khandjian et al. 1998). La réaction croisée observée n’est pas l’effet de cette insertion supplémentaire mais elle est plus facilement observable dans les cellules où la protéine FMR1 est absente. Puisque l’anticorps est dirigé contre un épitope en N-terminal, une région conservée entre les homologues, l’anticorps 1C3 reconnaît une séquence similaire dans FXR1. Il est aussi probable que les isoformes de 70 et de 78 kDa de FXR1 soient responsables d’une partie du signal observé dans les isoformes de FMR1.

Malgré les nombreuses similitudes entre les protéines de la famille FXR, les données recueillies suggèrent qu’elles jouent des rôles différents dans la cellule, mais qui pourraient se chevaucher. Chez les patients X-fragile, les niveaux d’expression des protéines FXR1/FXR2 restent inchangés. Toutefois, il est possible qu’elles compensent subtilement l’absence de la protéine FMR1 par une augmentation de leur activité.

La recherche de la fonction de la protéine FMR1 passe inévitablement par l’identification de ses partenaires cellulaires. Tout d’abord, il a été montré que les trois protéines de la famille FMR/FXR pouvaient s’hétérodimériser mais que leur homodimérisation s’accordait plus avec la réalité in vivo (Zhang et al. 1995). L’immunoprécipitation de la protéine FMR1 (avec une protéine recombinante portant un flag) a permis de démontrer la présence des homologues dans les mêmes extraits (Bardoni et al. 1999; Ceman et al. 1999). La nucléoline est l’une des premières protéines à avoir été identifiée et bien qu’elle soit majoritairement située dans le nucléole, une portion est cytoplasmique et se retrouve dans des RNPs (Ceman et al. 1999). En plus de la nucléoline, les auteurs ont co-précipité 4 protéines de 100, 120, 150 et 400 kDa qu’ils tentent d’identifier actuellement. Ils ont aussi précipité la protéine hnRNPA1 mais son association à la mRNP s’effectue via l’ARN. Une étude subséquente a permis d’identifier la protéine YB1/P50 (Y-box binding protein) comme partenaire de FMR1 dans la mRNP (Ceman et al. 2000). Comme FMR1, cette protéine est aussi retrouvée dans les réticulocytes de lapin (Minich et al. 1993; Evdokimova et al. 1995) et sa séquence est extrêmement bien conservée entre le lapin et l’humain (97 % d’identité).

Le criblage d’une banque d’expression de cDNAs d’embryon murin à l’aide du système double-hybride dans la levure a aussi permis d’identifier d’autres protéines interagissant avec la protéine FMR1. Un des premiers partenaire identifié est une protéine nucléaire; NUFIP (NUclear Fmrp Interacting Protein 1) qui interagit avec la protéine FMR1 mais pas avec les homologues (Bardoni et al. 1999). Deux autres partenaires, NUCIF1 (NUclear and Cytoplasmic Interactor of Fmrp 1) et CYFIP1 (CYtoplasmic Fmrp Interacting Protein 1) ont été isolés et la recherche de séquences homologues a permis de trouver l’homologue CYFIP2 qui interagit aussi avec la protéine FMR1. Ces protéines sont retrouvées principalement dans le cytoplasme où elles sont associées aux polyribosomes. Au niveau fonctionnel, CYFIP1 a été caractérisée comme intéragissant avec la petite GTPase Rac1 (Kobayashi et al. 1998). Cette dernière est impliquée dans différents aspects de la biologie neuronale dont la maturation et le maintien des épines dendritiques, des structures fortement affectées chez les patients X-fragile (Rudelli et al. 1985; Hinton et al. 1991) et la souris knock-out (Consortium 1994; Comery et al. 1997; Kooy et al. 1999; Nimchinsky et al. 2001). Alors que CYFIP2 interagit avec les trois protéines FMR/FXR, CYFIP1, NUCIF1 et NUFIP s’associent uniquement à FMR1 et cette différence d’interaction pourrait conférer une certaine spécificité à la protéine. De plus, les protéines identifiées comme composantes potentielles du complexe ribonucléoprotéique comprenant la protéine FMR1 n’ont pas toutes une localisation intracellulaire identique indiquant que leur fonction dans la mRNP se situerait à différents niveaux.

Avant l’identification de la mutation dynamique responsable de la majorité des cas de syndrome X-fragile, le diagnostic des malades s’effectuait uniquement par la visualisation du site fragile par cytogénétique. Toutefois, seulement 50 % des personnes atteintes présentent le site fragile (Sherman et al. 1984) et deux autres sites fragiles se trouvent à proximité: le site FRAXE à 600 kb et le site FRAXF à 1-2 Mb de FRAXA (Suthers et al. 1990; Flynn et al. 1993; Hirst et al. 1993). Le test cytogénétique ne convenait donc pas pour le diagnostic prénatal compte tenu de sa faible fiabilité.

L’identification de l’expansion de l’ADN et de la méthylation responsable du syndrome s’effectue grâce à des doubles digestions avec une enzyme coupant fréquemment (EcoRI) et une enzyme sensible à la méthylation (Eag I). L’ADN digéré est ensuite séparé par électrophorèse sur gel d’agarose et les produits de digestion visualisés à l’aide d’une sonde marquée s’hybridant spécifiquement aux fragments comprenant la séquence répétée (Oberle et al. 1991). L’hybridation Southern est devenue, et demeure la méthode diagnostique de référence puisqu’elle permet d’identifier avec certitude les personnes normales, les porteuses d’une prémutation et celles ayant une mutation complète. Seule la limite inférieure des prémutations est une zone d’incertitude car la résolution de cette technique est d’environ 90 paires de bases, soit 30 triplets, et ne permet pas toujours de distinguer les petites prémutations des grands allèles normaux. Toutefois, cela ne nuit pas au diagnostic et on peut toujours mesurer précisément le nombre de triplets par PCR. La double digestion permet de déterminer le niveau de méthylation et de différencier les grandes prémutations des mutations complètes. La méthylation étant responsable de l’inactivation du gène, cette information s’avère autant sinon plus importante que la longueur de l’expansion.

La technique est coûteuse et fastidieuse mais puisqu’aucune autre méthode diagnostique n’offre une sensibilité et une spécificité aussi proche de 100 %, l’hybridation Southern restera le modus operandi des laboratoires de diagnostic fiables pour le moment. D’ailleurs, une mini-méthode permettant d’examiner un grand nombre d’échantillons simultanément, plus rapidement et à un coût similaire à celui de la PCR a été mise au point dans le laboratoire du Dr. Rousseau (Rousseau et al. 1994a).

Puisque l’expansion d’une séquence répétée est associé au syndrome X-fragile, plusieurs laboratoires ont tenté de mettre au point un protocole pour amplifier les répétitions à l’aide de la réaction PCR (Fu et al. 1991; Brown et al. 1993; Haddad et al. 1996; Boday et al. 1998; Duran Dominguez et al. 2001). En comparant le produit PCR (radioactif ou non) à une échelle de référence, il est possible de calculer exactement le nombre de triplets composant la répétition. Par contre, le contenu riche en cytosine (C) et guanine (G) de cette région (pratiquement 100 %) rend techniquement difficile, pour ne pas dire impossible, d’amplifier suffisamment de fragments pour permettre la visualisation directe des mutations complètes. Pour contourner ce problème, un protocole incluant une étape de transfert sur nitrocellulose et d’hybridation avec une sonde (CGG)n marquée a été mis au point et permet de détecter et mesurer les allèles mutés (el-Aleem et al. 1995; Hecimovic et al. 1997). Ces étapes supplémentaires ont toutefois des répercussions sur le coût et le temps alloués au diagnostic ainsi que sur la précision de la mesure du nombre de triplet. De plus, cette technique ne permet pas de déterminer le statut de méthylation. Récemment, deux méthodes permettant d’amplifier uniquement les CpG méthylés chez les mâles atteints ont été publiées (Das et al. 1997; Panagopoulos et al. 1999) mais elles ne sont pas encore utilisées pour le diagnostic.

Au cours des dernières années, deux polymérases permettant “supposément” d’amplifier les mutations complètes sont devenues disponibles commercialement (Herculase™ et Expand™ long PCR). Malgré tout, un problème persiste dans l’utilisation de la PCR: il s’agit du mosaïcisme décrit précédemment. Au cours de la réaction PCR, l’amplification préférentielle des petits fragments peut générer un résultat faux-négatif pour le diagnostic. Nous avons vérifié cette hypothèse sur des patients diagnostiqués antérieurement par hybridation Southern. Chez plus de 10 % des patients ayant une mutation complète, la PCR a généré un produit de longueur normale ou prémutée. De plus, les patients pour lesquels la PCR a généré un produit PCR visible n’étaient pas tous des mosaïques tel que déterminé par hybridation Southern. Ceci suggère que le taux de mosaïcisme est peut-être plus élevé que ce qui est mesurable par hybridation Southern et qu’il est détecté plus efficacement par la PCR. Ainsi, malgré des polymérases plus performantes, l’hybridation Southern restera, pour le moment, la méthode la plus fiable pour le diagnostic.

La détection de la mutation et de sa méthylation ont toujours été l’élément central pour le diagnostic. La maladie étant causée par l’absence de la protéine FMR1, certaines équipes ont préféré diriger leurs efforts vers la détection de la protéine pour diagnostiquer la maladie. Les techniques immunologiques sont habituellement moins onéreuses que la PCR ou l’hybridation Southern car elle ne nécessitent que des anticorps qui peuvent être, la plupart du temps, produits par un hybridome que le laboratoire crée ou achète.

En 1993, Verheij et al (19993) ont préparé une série d’anticorps polyclonaux et ont démontré, tout comme Devys et al (1993) précédemment, que la protéine FMR1 est produite dans le cytoplasme des cellules d’une lignée lymphoblastique (Verheij et al. 1995). Puisque la protéine est absente chez les patients X-fragile, ce résultat ouvrait la voie au diagnostic avec les anticorps. La même année, Willemsen et al (1995) ont mis au point un test permettant de détecter la présence de la protéine dans les lymphocytes sur un frottis de sang. Cependant, il arrivait fréquemment que chez les patients X-fragile le cytoplasme des lymphocytes était coloré (donc exprimant la protéine), reflètant le mosaïcisme mentionné précédemment. Malgré cela, la puissance diagnostique de ce test est excellente pour les hommes puisqu’il n’y a aucun chevauchement entre le nombre de cellules colorées chez les normaux et es atteints.

Ceci n’est cependant pas le cas pour les femmes, compte tenu du processus d’inactivation aléatoire du chromosome X. En effet, certaines femmes porteuses d’une mutation complète expriment la protéine dans plus de 80 % de leur cellules, alors que 40 % des femmes normales expriment la protéine dans moins de 80 % de leur lymphocytes (Willemsen et al. 1997b).

Pour le diagnostic post-natal, la même équipe a développé un test non-invasif permettant de détecter la protéine dans la racine des cheveux (Willemsen et al. 1999). Ce test a une puissance équivalente, chez les hommes, à celle du test effectué sur des frottis de sang. Les auteurs mentionnent qu’il pourrait y avoir une meilleure corrélation entre l’expression de FMR1 à la racine des cheveux et le retard mental compte tenu de l’origine embryonnaire commune entre le cerveau et la peau. Le test sur les racines de cheveux a été utilisé avec succès lors d’un programme de dépistage parmi des hommes retardés mentalement en Turquie (Tuncbilek et al. 2000).

La détection de la protéine FMR1 a aussi été appliquée au diagnostic prénatal sur des villosités choriales chez des femmes à risque enceintes de garçons (Willemsen et al. 1996). La protéine est fortement exprimée dans le cytotrophoblaste des villosités chez les enfants normaux. Cependant, le test ne peut-être effectué que sur les foetus agés de plus de 12.5 semaines puisque c’est à ce moment que les mutations complètes deviennent méthylées et que la protéine n’est plus exprimée (Willemsen et al. 2002). La détection de la protéine a aussi été effectuée sur le liquide amniotique (Willemsen et al. 1997a) et sur le sang foetal (Lambiris et al. 1999). L’avantage principal de cette méthode immunochimique est que le résultat est disponible la journée même du test, alors que l’hybridation Southern peut prendre jusqu’à 2 semaines. Le désavantage vient du fait que les femmes porteuses d’une mutation complète ne peuvent être identifiées avec certitude. Cette lacune est liée au fait que ces tests sont qualitatifs ou semi-quantitatifs. De plus, puisque la plupart des personnes ayant une prémutation produisent la protéine en quantité presque normale, elles ne peuvent être identifiées ainsi. Toutefois, deux études mentionnent que certaines personnes ayant une prémutation produisent moins de protéines qu’une personne ayant des allèles de longueurs normales (Tassone et al. 2000a; Tassone et al. 2000b). Il est possible qu’un test quantitatif suffisamment sensible permettre de quantifier cette différence contrairement aux tests mentionnés précédemment qui ne permettent pas d’identifier toutes les femmes porteuses d’une mutation complète ni les personnes ayant une prémutation. Le test immunochimique quantitatif deviendrait donc intéressant pour les laboratoires de diagnostic.

Les phages filamenteux M13, f1 et fd ont tous été utilisés pour la création de banques de phage display compte tenu de leur capacité commune à infecter les souches d ’Escherichia coli exprimant le pilus codé par le facteur F. Les phages filamenteux sont composés de 5 protéines (Figure 5) entourant un ADN circulaire simple brin d’environ 6500 nucléotides. L’adsorption du phage s’effectue à l’aide des protéines g6 et g3 (Boeke et al. 1982) et cette dernière est habituellement utilisée pour fusionner les molécules à sélectionner. Pour de petites molécules, cette fusion n’affecte pas la capacité d’infection du phage. Le génome des phages d’une banque de phage display (phagemide) ne contient que l’information nécessaire à la production de la protéine g3 recombinante et à la réplication du génome. Le reste du matériel génétique permettant la production des autres protéines de la capside est fourni par la co-infection avec un phage auxiliaire (M13K07). Cependant, le génome de ce dernier ne sera pas produit (ou très peu) puisqu’une mutation dans le gène g2 diminue l’affinité de la protéine produite pour sa propre origine de réplication. Le produit du gène 2 n’est pas présent dans la capside du phage mais sert à initier la réplication par cercle roulant en créant une cassure dans le génome double brin puis en coupant les génomes complets avant leur empaquetage. Ainsi le phagemide sera produit préférentiellement au génome du phage auxiliaire (Vieira and Messing 1987). Ce dernier fournira aussi une protéine g3p sauvage qui entrera en compétition avec la protéine g3p de fusion pour son incorporation dans la capside du phage. Ceci crée une certaine hétérogénéité dans le nombre de protéines de fusion présentés à la surface des bactériophages. Ainsi, certains phages présenteront de 1 à 5 copies de la protéine de fusion alors que les autres n’en présenteront aucune. Pour éviter cette compétition et s’assurer que tout les phages présentent les molécules d’intérêt, des phages auxiliaires n’ayant plus le gène codant pour la protéine g3p ont été développés (Griffiths et al. 1993; Rakonjac et al. 1997; Rondot et al. 2001).

Figure 4: Représentation du processus de sélection de fragments d’anticorps par la technique du “phage display”.

Les rectangles représentent les phages et les cercles colorés représentent les fragments d’anticorps (scFv).

= antigènes fixés sur un support solide (immunotubes) pour la sélection.

Figure 5: Structure du bactériophage M13.

Ce phage a été est le plus utilisé pour la construction de banques de “phage display”. * Les protéines ou peptides exprimés dans la banque sont fusionnés avec la protéine g3p. Les fragments d’anticorps pouvant être fusionnés sont représentés à la figure 6 et le processus de sélection est représenté à la figure 5. Le nombre de protéines ainsi que leur poids moléculaire est inscrit entre parenthèse.

Une des applications prometteuses de cette technologie est la création de banques synthétiques de fragments d’anticorps. (Figure 6) Ce type de banque permet entre autre d’outrepasser l’immunisation et d’obtenir des anticorps dirigés contre des molécules de l’hôte. Ces anticorps seraient normalement difficiles à obtenir à cause du mécanisme de tolérance du système immunitaire de l’hôte. Pour obtenir des anticorps de haute affinité, il faut exposer l’hôte plusieurs fois à l’antigène et de meilleurs anticorps seront créés par mutation de ceux obtenus lors de la réponse primaire (Berek and Milstein 1987). Dans le phage display, on peut aussi obtenir ce type de maturation artificiellement. Un répertoire de fragments d’anticorps est obtenu en combinant les différentes chaînes lourdes (VH) et légères (VL= Vκ + Vλ). L’approche utilisée influencera grandement la diversité générée. Chaque répertoire, VH et VL peut être cloné dans deux vecteurs différents pour être recombiné in vitro (Hogrefe et al. 1993a; Hogrefe et al. 1993b) ou in vivo (Waterhouse et al. 1993) par la suite. Il est aussi possible de cloner séquentiellement chacun des gènes dans un même vecteur (Barbas et al. 1991) ou de procéder à leur assemblage par PCR et les cloner dans un vecteur commun (Clackson et al. 1991). Les répertoires sont combinés au hasard ce qui permet de créer de nouvelles spécificités (Marks et al. 1991). À la suite de la sélection des meilleurs fragments, des mutations peuvent être introduites au hasard in vitro (Gram et al. 1992; Hawkins et al. 1992), en utilisant une polymérase faisant des erreurs (Leung et al. 1989), ou in vivo en infectant des souches bactériennes créant des mutations (Schaaper 1988; Yamagishi et al. 1990). Une nouvelle sélection est ensuite effectuée sur les nouveaux phages afin de sélectionner les meilleurs. Cette maturation artificielle permet d’obtenir des anticorps ayant une affinité semblable à celle des anticorps issus d’une réponse secondaire chez un animal. On retrouve quelques exemples intéressants dans la littérature (Clackson et al. 1991; Griffiths et al. 1993 et 1994, de Lorenzo et al. 2002)

Figure 6: Représentation des différents types de fragments d’anticorps pouvant être exprimés à la surface de phages pour la sélection en phage display.

A) Anticorps complet, B) Fragments Fab, C) Fragments variables reliés par un pont disulfure et D) Fragments variables reliés en une seule chaîne par un peptide artificiel (souvent une (Gly3-Ser3)3).

Une décennie s’est écoulée depuis l’obtention des premiers anticorps dirigés contre la protéine FMR1 et l’anticorps 1C3 s’est avéré le plus efficace pour les études effectuées malgré les nombreuses tentatives d’en produire des meilleurs. Cet anticorps présente une bonne spécificité mais la réaction croisée avec la protéine homologue FXR1 peut limiter certaines expériences. L’anticorps 1C3 détecte toutes les isofomes de la protéine FMR1 mais il serait intéressant d’obtenir un outil permettant de les discriminer.

Dans cette optique, nous avons entrepris la génération d’anticorps par la technologie du phage display et la création de nouveaux hybridomes. Dans un premier temps, nous utiliserons la banque de phage Griffin.1 pour sélectionner des scFvs dirigés contre la protéine FMR1 complète et un peptide de 15 acides aminés qui lui est unique. La protéine complète servira aussi à l’immunisation de 4 souris pour la génération d’hybridomes. La caractérisation des anticorps et des scFvs débutera avec la cartographie des épitopes reconnus et la classe et sous-classe des anticorps monoclonaux obtenus. Nous vérifierons ensuite si les anticorps (et scFvs) peuvent être utilisés pour les techniques suivantes: immunobuvardage, immunofluorescence, immunohistochimie, l’ELISA et l’immunoprécipitation. Nous espérons ainsi fournir de nouveaux outils de biologie moléculaire pour l’étude de la protéine impliquée dans le syndrome X-fragile.

Nous tenterons aussi la mise au point d’un test de dosage par ELISA-sandwich à l’aide d’anticorps reconnaissant des épitopes suffisamment distants. La mise au point se fera sur la protéine FMR1 purifiée qui servira de courbe standard lors du dosage. Nous effectuerons ensuite la mise au point sur des extraits de lignées lymphoblastiques normale et X-fragile, le but ultime de cette expérience étant de doser la protéine de leucocytes extraits du sang afin de créer une méthode diagnostique plus rapide et moins onéreuse que celles présentement disponibles.

Si la sélection de scFv avec la banque Griffin.1 fonctionne bien, nous tenterons la sélection de fragments variables (scFvs) dirigés contre les nouvelles jonctions exon-exon et la nouvelle portion carboxy-terminale créée à la suite de l’épissage alternatif du transcrit primaire de FMR1 . Ces scFvs seront ensuite utilisés pour déterminer l’existence des différentes isoformes de FMR1. Nous vérifierons par la suite la localisation cellulaire des isoformes existantes ainsi que leur distribution tissulaires. Ces informations pourraient permettre d’éclaircir le rôle joué par la protéine FMR1 et la signification biologique de l’existence des multiples isoformes.