1. Introduction

Table des matières

La HT I est une maladie autosomale récessive. Au Québec, elle touche particulièrement la région du Saguenay-Lac-St-Jean (SLSJ), où son incidence était d’un

Figure 1. Le sentier catabolique de la tyrosine.

Ce schéma inclut la formation de la L-tyrosine par l’hydroxylation de la phénylalanine. Les enzymes du sentier sont en gras. L’inhibiteur de la 4-hydroxyphénylpyruvate dioxygénase, le 2-(nitro-4-fluorométhylbenzoyl)-1,3-cyclohexanedione (NTBC) y est représenté. La croix rouge symbolise l’inhibition de la HPPD par le NTBC.

nouveau-né sur 1846 naissances au début des années 1990, avant l’avènement des tests prénataux de diagnostic (De Braekeleer and Larochelle 1990), tandis que l’incidence mondiale de cette maladie était plutôt de l’ordre d’un nouveau-né affecté par 100 000 ou 120 000 naissances (Mitchell et al . 2001). Cette incidence élevée est causée par un effet « fondateur ». Durant le XVIIe et le XVIIIe siècle, il y a eu colonisation de la Nouvelle-France par des immigrants français provenant d’une les régions du nord-ouest de la France (Scriver 2001). Ces immigrants tendaient à se regrouper sur la rive nord du fleuve St-Laurent à l’est de la ville de Québec, dans la région de Charlevoix. Avec une colonisation de plus en plus florissante, il y a eu migration vers la région du SLSJ. Plusieurs de ces personnes étaient apparentées. Il a été proposé que moins de 250 immigrants de la Nouvelle-France sont responsables de l’effet fondateur observé aujourd’hui au SLSJ. De fait, la mutation IVS12+5g→a représente 95% des mutations retrouvées dans cette région (Grompe et al . 1994; Poudrier et al . 1996). Jusqu’à maintenant, 41 mutations causales de la maladies ont été documentées (St-Louis and Tanguay 1997; Bergman et al. 1998; Arranz et al. 2002; Elpeleg et al. 2002; Bergeron et al. 2003).

Il existait, avant l’avènement des traitements actuels de la maladie, deux formes cliniques de la maladie : la forme aiguë et la forme chronique (Mitchell et al . 2001). Dans la forme aiguë, les patients meurent d’insuffisance hépatique sévère dans les premiers mois de leur existence. La forme chronique se caractérise par une insuffisance hépatique graduelle et la formation d’hépatocarcinomes cellulaires est une complication fréquente. En général, les patients souffrant de cette forme de la maladie meurent dans la première année de leur existence. Puisque les patients, portant les mêmes mutations, présentent une hétérogénéité de symptômes, il n’est pas possible de prédire laquelle des formes cliniques affecte les patients (Poudrier et al . 1998).

La HTI est souvent caractérisée, indépendamment de la forme clinique des patients, par des crises hépatiques qui incluent les symptômes suivants : des jaunisses, une hépatomégalie, une élévation des acides aminés comme la tyrosine (Mitchell et al . 2001). Ces crises peuvent mener à la dysfonction complète du foie ou se résorber d’elles-mêmes. En dehors de ces épisodes de crises, les patients présentent des symptômes chroniques. En effet, il est possible d’observer une cirrhose importante et l’apparition d’hépatocarcinomes cellulaires. Des cas de crises neurologiques ont été documentées (Mitchell et al . 2001). Ces crises neurologiques n’affectent pas le développement mental des patients. Finalement, les reins présentent des dysfonction tubulaires légères ou complètes.

La base moléculaire de cette maladie est l’absence de la dernière enzyme du sentier de la dégradation de la tyrosine, la fumarylacétoacétate hydrolase (FAH, EC 3.7.1.2). L’absence de l’enzyme fonctionnelle entraîne l’accumulation de plusieurs métabolites du sentier, soit l’accumulation du maléylacétoacétate (MAA), le fumarylacétoacétate (FAA), le succinylacétoacétate (SAA) et le succinylacétone (SA).

Il a été démontré que l’accumulation de SA inhibe l’enzyme acide δ-aminolévulinique déhydratase (ALA-D), une enzyme impliquée dans la formation du porphobilinogène et de l’hème (Strife et al. 1977; Sassa and Kappas 1983; Mitchell et al. 2001). Il a été proposé que l’accumulation de l’acide δ-aminolévulinique (ALA) dans le foie cause son excrétion dans le sang. Cette molécule peut alors circuler jusqu’au cerveau et y causerait l’inhibition du SA résultant en crises neurologiques associées à la maladie.

Il a été également démontré que l’accumulation de FAA causerait une partie des symptômes observés au niveau du foie et des reins. En effet, il semble que le FAA entraîne trois fois plus de mutations dans des cellules traitées aux FAA comparativement à celles qui n’y sont pas soumises (Tanguay et al . 1996). Il est important de mentionner que cette étude n’a montré aucun effet mutagénique pour le MAA, ni pour le SA. De plus, la diminution du glutathion (GSH) intracellulaire augmenterait l’effet mutagénique du FAA (Jorquera and Tanguay 1997). Ces auteurs suggèrent que la protection que confère le GSH contre les effets cytotoxiques du FAA est due à un effet tampon, c’est à dire que le GSH se conjugue au FAA et empêche celui-ci de causer des dommages. Une étude sur des cellules V79 et HepG2 traitées au FAA, suggère que ce métabolite de la tyrosine arrête le cycle cellulaire à la transition G2/M et que cet arrêt entraîne l’apoptose (Jorquera and Tanguay 1999). Cette étude confirme également que l’effet cytotoxique du FAA est dépendant, non seulement de sa dose, mais aussi de la concentration intracellulaire de GSH. De plus, une dose non létale de FAA induit plusieurs anomalies dans la formation des fuseaux mitotiques et dans la ségrégation des chromosomes. Ces anomalies mènent à la formation de cellules multinucléées et à la formation de cellules avec des micronoyaux contenant des fragments de chromosomes et des centromères (aneugénèse) (Jorquera and Tanguay 2001). Donc, le FAA possède à la fois des propriétés mutagéniques et aneugéniques qui seraient responsables, du moins en partie, des phénotypes observés dans la HTI.

Il existe trois moyens de traiter cette maladie (Mitchell et al . 2001). La première est la plus drastique de ces mesures. Il s’agit de la transplantation hépatique et/ou rénale. Elle n’est maintenant pratiquée qu’en dernier recours puisque le patient doit subir une opération majeure qui peut entraîner plusieurs complications, dont le rejet de l’organe transplanté. De plus, la prise d’immunosupprésseurs et leurs effets à long terme constituent d’autres facteurs qui incitent les médecins à considérer d’autres avenues de traitement. Cependant, la transplantation du foie est le seul traitement qui prévienne l’apparition des hépatocarcinomes cellulaires.

Le deuxième traitement consiste à diminuer la prise de tyrosine et de phénylalanine dans l’alimentation des patients. Ceci à pour effet de diminuer l’accumulation des métabolites de la voie catabolique et donc de diminuer la gravité des symptômes du patient.

Le dernier traitement consiste à combiner la diète restrictive et la prise d’un inhibiteur du sentier catabolique de la tyrosine: le 2-(2-nitro-4-trifluoromethylbenzoyl)-1,3-cyclohexanedione ou NTBC (Lindstedt et al . 1992). Cette molécule inhibe de façon compétitive l’enzyme ρ-hydroxyphénylpyruvate dioxygénase (HPPD) (Lindstedt et al . 1992). Ceci empêche la formation de FAA ce qui a pour but de prévenir l’apparition des symptômes aigus de la maladie. Cependant, même si les patients se portent bien après la prise de NTBC, il semble que cet inhibiteur ne rétablit pas parfaitement le phénotype moléculaire (Luijerink et al . 2003). Selon Luijerink et ses collaborateurs, ceci pourrait mener à la formation d’hépatocarcinomes cellulaires à long terme. De plus, une étude sur des souris, nulle pour le gène fah, montre que lorsque le NTBC est retiré deux semaines avant les traitements expérimentaux, les souris sont capables de survivre à des doses normalement létales de HGA (le HGA étant transformé MAA qui est converti en FAA figure 1) (Vogel et al . 2004). Selon ces derniers, l’interruption du traitement au NTBC pendant deux semaines, entraîne l’apparition de dommages chroniques au foie. Ils ont montré que l’expression des gènes hsp27 , hsp32 et hsp70 est augmentée dans ces souris. Les Hsp sont reconnues comme des facteurs anti-apoptotiques. De même, c-Jun, un proto-oncogène, est surexprimé dans les hépatocytes de ces souris, mais pas dans les souris sous traitement au NTBC. La surexpression de ces gènes pourrait rendre les souris, retirées du traitement au NTBC, résistantes à l’apoptose. De plus, cette résistance à la réponse apoptotique n’est pas confinée seulement aux métabolites de la FAH, mais elle est aussi observée lorsque les auteurs ont tenté d’induire l’apoptose par le ligand Fas ou par l’acétaminophène. Selon eux, cette déficience du programme de mort cellulaire pourrait mener à l’accumulation de cellules endommagées et donc, d’augmenter le risque de formation des hépatocarcinomes cellulaires. Ceci amène un autre indice suggérant que la prise de NTBC n’est pas capable à elle seule de prévenir la formation de cellules cancéreuses. Cependant, de nos jours, le NTBC en conjonction avec la diète restrictive en tyrosine et en phénylalanine est le traitement de prédilection (Mitchell et al . 2001).

Malgré la découverte du NTBC pour traiter la HTI, il semble qu’aucun des traitements alternatifs ne prévienne la formation des carcinomes hépatocellulaires. La présence de nodules positifs à la FAH, dans le foie de plusieurs patients tyrosinémiques, homozygotes pour une mutation, a ouvert la voie à de nouveaux traitements (Kvittingen et al . 1993; Kvittingen et al . 1994). La réversion des mutations de la FAH a permis de trouver une corrélation inversement proportionnelle entre le pourcentage de réversion des hépatocytes fah -/- en fah +/+ dans le foie des patients et la sévérité de la maladie (Demers et al . 2003). De plus, ce groupe a observé que les carcinomes hépato-cellulaires n’originaient que des régions où il y avait absence de réversion.

La découverte des nodules révertés et le fait qu’ils aient un avantage sélectif de croissance ont simulé les études permettant de voir si la thérapie génique pourrait constituer un moyen thérapeutique alternatif pour traiter la HTI en empêchant la formation d’hépatocarcinomes cellulaires. Cette technique a été appliquée pour corriger la déficience en FAH d’une lignée primaire obtenue à partir de patients HTI. Des fibroblastes primaires de patients HTI ont été corrigés avec succès après transfection stable par un vecteur rétroviral contenant l’ADNc de la FAH (Phaneuf et al . 1995). Cette réussite a mené à la thérapie génique dans un modèle murin de la HTI (Overturf et al . 1996). L’administration de plusieurs doses de rétrovirus contenant l’ADNc de la FAH a permis la correction de près de 90% des hépatocytes. Par la suite, un vecteur adénoviral a été utilisé pour corriger la déficience en FAH dans ce même modèle murin (Overturf et al . 1997). Ceci a permis de confirmer l’avantage de croissance que possèdent les hépatocytes corrigés et mis en évidence la formation des hépatocarcinomes cellulaires à partir des hépatocytes non-corrigés.

Une autre preuve en faveur du danger que posent les hépatocytes non-corrigés a été montrée par une étude à long terme sur un modèle de souris ayant été corrigé par un vecteur rétroviral (Grompe et al . 1998). Cette étude a démontré que ces souris étaient en santé pendant les 12 premiers mois, mais après ce temps, plus de 60% des souris développaient des carcinomes. L’analyse par transfert d’ADN ( Southern blot ) des tissus de ces souris a montré que ces carcinomes n’étaient pas dus à l’insertion du rétrovirus devant un oncogène mais bien à la présence d’hépatocytes n’ayant pas été corrigés. Une modification à l’approche traditionnelle de la thérapie génique a été de corriger les hépatocytes ex vivo à l’aide d’un rétrovirus avant de les introduire par greffe sur le foie de souris fah -/- (Overturf et al . 1998).

Finalement, l’ADN nu a été utilisé comme vecteur pour corriger la HTI chez la souris à l’aide de la transposase Sleeping beauty (Montini et al . 2002). Bien que capable de traiter la tyrosinémie, cette technique souffre d’un faible taux de transfert de gène (environ 4% des hépatocytes transfectés exprimaient la FAH) comparativement aux méthodes virales. Cependant, le nombre de transgènes de FAH par génome diploïde était égal à un. Ceci suggère que le peu de transpositions observés chez ces souris mène à une intégration capable de produire de la FAH. En résumé, la thérapie génique a été utilisée avec succès pour traiter la tyrosinémie dans un modèle murin, mais avant de pouvoir l’appliquer chez l’humain, il faut augmenter le taux de transfert de gène pour que tous les hépatocytes du foie soient corrigés, évitant ainsi l’apparition de carcinomes hépatocellulaires.

Une déficience de la première enzyme, la TAT entraîne une accumulation de la tyrosine excédentaire de l’organisme. Cette accumulation cause la tyrosinémie héréditaire de type II (HTII) (Mitchell et al . 2001). Cette maladie est aussi connue sous le nom de tyrosinémie oculocutanée puisqu’elle affecte la peau, la cornée et même le système nerveux central.

Une déficience de la HPPD peut entraîner trois types de maladies (Mitchell et al . 2001). La première est la tyrosinémie héréditaire la plus rare, dite de type III (HTIII). Étant donné le nombre peu élevé de cas rapportés (2 cas), il est difficile d’identifier les symptômes et les causes de cette maladie. Il est possible qu’il existe des patients asymptomatiques pour cette condition. La seconde maladie connue sous le nom de hawkinsinurie est causée par une expression anormale de cette enzyme. Cette maladie autosomale dominante est aussi très rare. Contrairement aux tyrosinémies, les individus affectés par la hawkinsinurie possède un allèle normal. Les symptômes connus sont l’acidose métabolique et un retard dans le développement après sevrage de l’allaitement au sein. Finalement, le désordre appelé tyrosinémie transitoire du nouveau-né est la dernière perturbation du sentier de la tyrosine associée à un défaut de la HPPD. Cette maladie se résorbe, d’elle-même, en favorisant une diète faible en protéines.

Le dernier désordre connu du sentier catabolique de la tyrosine est l’alkaptonurie. Cette maladie est causée par la déficience en HGO (La Du 2001). Cette déficience entraîne l’accumulation de l’homogentisate (HGA), causant l’ochronose ; une accumulation douloureuse de l’homogentisate dans le cartilage et dans les tissus collagéneux, ainsi que la destruction des articulations et la détérioration des valves cardiaques (Phornphutkul et al . 2002).

La déficience de la FAH chez l’être humain cause la HTI, le désordre le plus sévère dans le métabolisme de la tyrosine. Cette enzyme hydrolyse la fumarylacétoacétate en fumarate et en acétoacétate (figure 1).

Le gène de la fah humaine est localisé dans la région q23-q25 sur le chromosome 15 en une copie par génome haploïde (Phaneuf et al . 1991). Ce gène couvre environ 35kb et contient 14 exons (Labelle et al . 1993; Awata et al . 1994b). Au moins deux cas d’épissage alternatif sont connus (Dreumont et al . 2005). Les mécanismes de régulation de la FAH sont toujours incompris, toutefois l’analyse bioinformatique de la région promotrice révèle l’absence de boîtes CAAT, TATA et la présence de 11 sites Sp1 dans une région riche en GC (Labelle et al . 1993). Ces caractéristiques sont généralement associées à la régulation transcriptionnelle de gènes ubiquitaires ( housekeeping genes ). Cependant, la FAH est principalement exprimée au niveau du foie et des reins chez l’humain (Kvittingen et al . 1983; Berger et al . 1987; Tanguay et al . 1990)

Le gène murin a été localisé sur le chromosome 7 (Klebig et al . 1992). Cette région d’ADN est synténique à celle trouvée chez l’humain. Il contient 14 exons et s’étend sur 20,6 kb. Le patron d’expression du gène murin n’a pas été sujet à publication, mais aucune observation ne laisse présager de différence dans son expression par rapport au gène humain. De plus, aucun épissage alternatif n’est connu pour ce gène chez cet organisme et les mécanismes de la régulation transcriptionnelle ne sont pas connus.

L’ADNc de la FAH humaine contient un cadre de lecture ouvert (ORF) de 1257 pb qui encode 419 acides aminés (Phaneuf et al . 1991). L’enzyme agit en homodimère. La séquence protéique et nucléique de la FAH humaine sont conservées chez le rat et la souris. L’identité de séquence au niveau des acides aminés est de 94% et au niveau de l’ADN est de 83% entre l’humain et le rat (Labelle et al . 1991; Phaneuf et al . 1991). L’identité de séquence entre la souris et l’humain, est de 94% en acides aminés et de 80% en nucléotides (Klebig et al . 1992)

La structure crystallographique de la FAH a été résolue en 1999 (Timm et al . 1999). Le polypeptide est réplié dans un domaine N-terminal de 120 résidus et un domaine C-terminal de 300 résidus. Suite à l’analyse de la structure du cristal, les auteurs ont conclu que la FAH définissait une nouvelle classe de métallo-enzyme caractérisée par une structure unique de repliement α/β. De plus, ils ont conclu grâce aux analyses de mutations, par la conservation de la séquence et des observations structurales que le mécanisme de la catalyse de la FAH dépend de la triade catalytique Glu-His-H2O. De plus, la structure crystallographique de la FAH liée à un inhibiteur capable de déplacer le FAA, le 4-(hydroxyméthylphosphinoyl)-3-oxo-butanoique (HMPOBA), a été obtenue (Bateman et al . 2001). La structure du complexe FAH-HMPOBA supporte le rôle identifié pour la triade catalytique dans l’hydrolyse des liens carbone-carbone.

L’effet de huit mutations faux-sens sur la structure et l’activité de cette protéine on été étudiés (Bergeron et al . 2001). L’analyse des mutations N16I, F62C, C193R et W234G suggère qu’elles empêcheraient le repliement normal de la FAH. L’analyse de la distribution cellulaire des variants A134D, D233V, Q279R et R341W suggère qu’ils sont exprimés de façon similaire à la FAH. L’analyse de l’activité des protéines mutées obtenues à partir de ces quatre variants suggère que seulement Q279R et R341W ont une activité hydrolytique. L’analyse structurale de ces quatre mutations montre des perturbations significatives dans la structure α/β, à l’exception de Q279R. L’analyse subséquente de la mutation Q279R suggère que cette mutation affecte l’épissage de l’exon 9, puisqu’elle se retrouve au niveau de la région du site donneur de l’épissage (Dreumont et al . 2001). Les auteurs proposent que cette mutation in vivo serait plutôt une mutation d’épissage qu’une mutation faux-sens. En résumé, la découverte de la structure crystallographique et les études structurales de la FAH permettent de mieux comprendre leurs effets sur l’enzyme.

Un des premiers modèles murins, la délétion létale albinos C14CoS, a été très utile pour l’étude de la HTI. Cette délétion de 3,8 Mb touche le chromosome 7 de la souris (Kelsey et al . 1992). Les souris homozygotes pour ce locus meurent quelques heures après leur naissance (Kelsey and Schutz 1993). Étrangement, les phénotypes observés sont restreints à seulement deux types cellulaires : les hépatocytes et les cellules tubulaires proximales des reins. Il a été montré par clonage positionnel qu’une des enzymes touchées, qui est responsable du phénotype néonatal observé, n’est autre que la FAH (Klebig et al . 1992; Ruppert et al . 1992). De plus, des souris C14CoS homozygotes qui expriment des transgènes de la FAH sont corrigées pour la délétion, renforçant du même coup que le phénotype est bien dû à un blocage de la voie catabolique de la tyrosine (Kelsey et al . 1993) (Kelsey et al . 1993). Bien que ce modèle a permis de prouver que la HTI est due a une déficience en FAH, le phénotype néonatal létal et la grande taille de la délétion limitent son utilité.

Dans le but d’obtenir un modèle murin où seul l’expression d’un gène est perturbée, une souris nulle pour l’allèle de la FAH a été obtenue (Grompe et al . 1993). La souris knock-out ou fah -/- est obtenue après une recombinaison homologue qui vient perturber l’exon 5 du gène de la fah . Ce modèle est beaucoup plus utile pour étudier la HTI puisque seulement le gène de la fah est déficient. Tout de même, ces souris meurent 12 heures après la naissance et le patron d’expression des ARNm perturbés est similaire à celui observé chez les souris C14CoS. Ce modèle a permis de tester les stratégies thérapeutiques comme le NTBC (Lindstedt et al . 1992) ou les nombreuses thérapies géniques présentées précédemment.

Un autre modèle dérivé des souris C14CoS permet d’étudier l’apoptose et les dommages rénaux (Endo et al . 1997; Sun et al . 2000). Ce modèle est obtenu en croisant des souris déficientes en HPPD ( hppd -/-) avec des souris hétérozygotes C14CoS. Ce croisement permet d’obtenir des souris ayant un défaut génétique double, soit fah -/- et hppd -/-. Tout comme pour les souris fah -/- traitées au NTBC, ces souris semblent normales et le foie ne semble pas subir de dommage. La réintroduction de la HPPD à des souris doubles mutantes s’accompagne de l’apparition des symptômes observés pour les souris C14CoS. Les souris deviennent malades après 12 heures et meurent 30 heures après l’introduction de la HPPD (Endo et al . 1997).

Dans le but d’obtenir un modèle animal de la HTI où la perturbation génomique se rapproche le plus de celle rencontrée chez l’humain, des souris ayant des mutations ponctuelles ont été obtenues. Le modèle murin appelé Fah 5961SB a été obtenu en utilisant le mutagène N-éthyl-N-nitrosourea (ENU) (Aponte et al . 2001). Les souris 5961SB possèdent une mutation qui change un G pour un A à la fin de l’exon 6 et affecte la définition du site donneur d’épissage. Ceci entraîne l’épissage de l’exon 7 et introduit un codon stop à la position 303. Par conséquent, la protéine n’est pas produite. Les souris homozygotes pour cet allèle meurent à la naissance. Ce phénotype ressemble à la forme aiguë rencontrée chez certains patients tyrosinémiques. Une autre mutation a été produite par le mutagène ENU, elle se nomme Fah 6287SB (Aponte et al . 2001). Elle génère une mutation faux-sens nommée E201G. Une protéine est produite mais les souris meurent à l’âge juvénile. Le phénotype de ce modèle rappelle la forme chronique de la maladie.

Pour bien comprendre comment un gène est régulé, il est essentiel de connaître les niveaux hiérarchiques de la régulation transcriptionnelle (van Driel et al . 2003). Le premier niveau hiérarchique est la séquence d’ADN ou élément cis . Ce niveau inclut le promoteur basal, les séquences stimulatrices ( enhancer ), les séquences inhibitrices ( silencer ) et autres séquences d’ADN connues pour réguler la transcription d’un gène. Nous allons revenir sur ce niveau un peu plus loin. Le deuxième niveau de régulation est le niveau de compaction de la chromatine. Ce niveau inclut les modifications post-traductionnelles des histones qui influencent le niveau de compaction-décompaction de la chromatine (Turner 2002). Finalement, le niveau nucléaire semble aussi important pour la régulation des gènes. Ce niveau réfère à la position des différentes région des chromosomes dans le noyau en interphase qui sont appelées territoires de chromosomes. Un bon exemple est le nucléole où plusieurs chromosomes sont rassemblés pour la synthèse des ARNr (Pederson and Politz 2000).

Lors de l’étude de la régulation transcriptionnelle d’un gène, il est important de déterminer quels éléments cis et trans sont impliqués. Les éléments cis sont les séquences d’ADN reconnues par les facteurs trans qui sont des protéines connues sont le nom de facteurs de transcription. Tous ces éléments sont impliqués dans la régulation transcriptionnelle effectuée par le premier niveau hiérarchique.

Nous allons aborder sommairement les séquences d’ADN nécessaires à la régulation transcriptionnelle (figure 2). Le positionnement du complexe de l’ARN polymérase II (ARN pol. II) au site d’initiation de la transcription (SIT), nécessite la présence de certains

Figure 2. Séquence primaire d’ADN régulatrice de la transcription.

Représentation schématique des séquences qui régulent l’activation de la transcription. Le SIT de ce gène hypothétique est représenté par la flèche noire. Les différents éléments régulateurs sont représentés par des boîtes de couleur : en vert la boîte TATA, en bleu foncé la boîte DPE, en orange le site Inr, en jaune une boîte Sp1, en magenta une boîte CCAAT et en bleu la séquence stimulatrice reconnue par le complexe de l’ enhanceosome de l’interféron-γ.

éléments d’ADN (Lee and Young 2000). L’ensemble de ces séquences définit le promoteur minimal. Au moins trois séquences d’ADN sont connues pour être impliquées dans l’activation d’un promoteur minimal. La plus connue est la boîte TATA, dont la séquence consensus TATAAA est reconnue par la protéine s’y liant ( TATA-Binding Protein , TBP). La protéine TBP est une sous-unité du complexe TFIID de l’ARN pol. II, complexe qui aide à positionner correctement la machinerie transcriptionnelle. Cette boîte se retrouve de 25 à 30 nucléotides en amont du site d’initiation de la transcription.

Le site initiateur de la transcription ( Initiator , Inr) est défini comme étant la séquence entourant le site d’initiation de la transcription et serait présent dans 85% des séquences potentiellement promotrices (Suzuki et al . 2001). Sa séquence consensus pour les promoteurs de mammifères est riche en pyrimidine: Py-Py-A+1-N-T/A-Py-Py (Javahery et al . 1994). De plus, cette séquence est suffisante pour permettre l’initiation correcte de la transcription de gènes en absence de boîte TATA (Smale 1997). Il a été montré que les facteurs associés à TBP ( TBP-Associated Factors , TAFII) TAFII150 et TAFII250 reconnaissent cette séquence et permettent au complexe TFIID de s’y lier correctement (Chalkley and Verrijzer 1999). Finalement, l’élément qui est appelé promoteur en aval ( Downstream Promoter Element , DPE), situé entre 28 pb et 33 pb en aval du site d’initiation de la transcription, est reconnu par dTAFII60 chez la drosophile (Burke and Kadonaga 1996; Burke and Kadonaga 1997). Sa séquence consensus est A/G-G-A/T-C-G-T-G (Burke and Kadonaga 1997). Généralement, l’élément DPE est présent dans les promoteurs sans boîte TATA, quoiqu’une étude sommaire des régions promotrices de plusieurs gènes de la drosophile montre que 14% des séquences promotrices contiennent ces deux éléments (Kutach and Kadonaga 2000). En somme, les séquences mentionnées ci-haut, bien qu’elles soient essentielles au positionnement de la machinerie transcriptionnelle et à l’initiation de la transcription, semblent absentes de certains promoteurs (Smale 2001).

D’autres séquences sont nécessaires à l’initiation de le transcription mais aussi à l’activation des promoteurs minimaux. Ces éléments sont connus sous le nom de co-activateurs ou d’éléments promoteurs en amont. Ces séquences sont nécessaires à l’activation accrue de la transcription particulière à chaque type cellulaire ou en réponse à un stimulus particulier. Les éléments Sp1, la boîte CAAT et les éléments de réponse aux glucocorticoïdes (GRE; G lucocorticoid Response Element ) sont des exemples de ce type d’éléments. Finalement, il y a les séquences stimulatrices. Ces séquences se définissent comme des sites de liaison à des régulateurs positifs de la transcription et qui influencent ce mécanisme indépendamment de leur orientation par rapport au brin codant de l’ADN et à des distances pouvant aller jusqu’à 85 kb du SIT (Lee and Young 2000). Un exemple de séquence stimulatrice est celle reconnue par le complexe appelé enhanceosome , un complexe protéique inductible par infection virale et responsable de la transcription de l’interféron-γ (Merika and Thanos 2001). De plus, il y a des séquences inhibitrices qui inhibent l’activité promotrice indépendamment de leur orientation et de leur position par rapport au SIT (Lee and Young 2000).

Il y a plusieurs types de séquences qui sont responsables de la régulation au niveau des éléments promoteurs en amont. Nous allons définir les principaux acteurs responsables de la transcription spécifique au foie ainsi que les éléments plus ubiquitaires :

  1. Facteurs de transcription ubiquitaires :

    1. Plusieurs promoteurs contiennent des séquences appelées boîtes GC et leurs dérivés, les boîtes GT/CACCC (Philipsen and Suske 1999; Suske 1999). Le premier élément connu pour se lier à ces séquences est le facteur de transcription Sp1 ( Specific protein 1 ) (Kadonaga et al . 1987). Depuis ce temps, plusieurs autres facteurs de transcription ont été découverts et regroupés dans la famille des facteurs de transcritpion Sp/XKLF ( Krüppel-like factors ). Tous les membres de cette famille se lient à l’ADN par leur domaine à doigt de zinc (Kaczynski et al . 2003). De plus en plus d’évidences tendent à démontrer que ces facteurs, bien qu’utilisés fréquemment par les promoteurs ubiquitaires, sont aussi capables d’activer certains gènes de manière spécifique à un tissu mais aussi à d’autres modes de contrôle comme le cycle cellulaire, les stages développementaux ou à la réponse aux facteurs de croissance (Black et al . 2001; Kaczynski et al . 2003; Reisinger et al . 2003). Par exemple, un rôle pour Sp1 dans l’apoptose induite par la bile a été identifié (Higuchi et al . 2004). En effet, la bile active le sentier de signalisation de la kinase N-terminale c-Jun, ce qui résulte à l’association de Sp1 au promoteur du récepteur de mort cellulaire DR5/TRAIL-R2. La stimulation du peptide YY par la facteur de croissance similaire à l’insuline ( Insulin-Like Growth Factor , IGF-1) est médiée en partie par Sp1 (Wang et al . 2004). L’expression du peptide YY est restreinte aux cellules endothéliales du colon, du pancréas et de l’iléum distal. La présence de IGF-1 stimule la production de Sp1 et la suppression de ces sites par mutagénèse dirigée abolit l’effet stimulateur de l’IGF-1. Une autre évidence du rôle de Sp1 dans la spécificité tissulaire est amenée par l’étude de l’expression du gène mitochondrial sérine:pyruvate aminotransférase (SPT) (Uchida et al . 2002). Ce gène contient deux SIT différents, le site en amont est utilisé en réponse aux niveaux de AMPc intracellulaires et celui en aval est utilisé pour l’expression continue du gène sans induction par des stimuli. Les auteurs ont montré que la surexpression de Sp1 augmente l’expression du promoteur contenant le SIT en aval et en amont. Finalement, Sp1 joue un rôle dans la régulation transcriptionelle des récepteurs de l’insuline (IR) (Foti et al . 2003). Chez les vertébrés, les IR semblent exprimés de façon ubiquitaire, mais pourraient répondre à différents stimuli. Donc, les sites de liaison pour Sp1 peuvent se retrouver autant dans les promoteurs ubiquitaires que spécifiques à un tissu ou induits en réponse à des stimuli particuliers.

  1. Facteurs de transcription enrichis dans le foie

    1. Les facteurs nucléaires des hépatocytes ( Hepatocyte Nuclear Factors , HNF)

      1. Sous-famille des HNF-1 : Cette classe est composée des facteurs HNF-1α et HNF-1β. Ces facteurs de transcription contiennent une variante de l’homéodomaine du facteur de trancription POU (acronyme dérivé des facteurs de trancription Pit-1, Oct-1, Oct-2 et les facteurs Unc-86 de C. elegans qui possèdent tous le même domaine de liaison à l’ADN) (Schrem et al . 2002). Ils fonctionnent en homo ou en hétérodimères. Ils sont impliqués dans l’activation des gènes suivants : le facteur de transcription PDX-1 (P ancreas Duodenum Homeobox-1 ) exprimé principalement dans le pancréas humain (Gerrish et al . 2001), le polypeptide transportant les anions organiques de type C (O rganic Anion Transporting Polypeptide , OATP-C) qui est une sous-classe de OATP exprimé spécifiquement dans les hépatocytes humains (Jung et al . 2001) et de l’enzyme sucrase-isomaltase (SI) exprimée de façon spécifique dans les intestins de souris (Boudreau et al . 2002).

      2. Sous-famille des HNF3 : Elle est composée des protéines HNF3-α, β et γ. Il y a au moins neuf isoformes différentes de HNF3 (Clevidence et al . 1993). Ces protéines ont une homologie avec le domaine Forkhead (Schrem et al . 2002). La sous-famille des HNF3 est impliquée dans la régulation transcriptionnelle du gène enrichi dans le foie, Hex (Denson et al . 2000) et du gène hépatique murin GLUT2, un transporteur de glucose de type 2 (Shen et al . 2001). De plus, un rôle indirect de HNF3 dans l’activation de certains gènes hépatiques a été démontré pour l’albumine, la transthyrétine, la transférrine, la phosphoénolpyruvate carboxykinase (PEPCK) et l’aldolase B lors de la surexpression d’un peptide HNF3 tronqué. Ce peptide inhibe l’expression des gènes mentionnés (Vallet et al . 1995). La surexpression de HNF3-β active la transcription du gène de l’albumine et de HNF1-β, mais pas de la PEPCK (Levinson-Dushnik and Benvenisty 1997).

      3. Sous-famille des HNF4 : Cette classe de facteur de transcription fait partie de la super-famille des récepteurs nucléaires. Les membres de cette famille incluent HNF4-α, β et γ (Schrem et al . 2002). Ils sont responsables de la régulations des gènes suivants : le facteur coactivateur 1α du récepteur γ du proliférateur activé du péroxisome (PGC-1α) (Rhee et al . 2003) et du gène de la prothrombine (Ceelie et al . 2003). Une analyse par puce génétique ( microarray ) a permis d’identifier les gènes probablement régulés par HNF4 dont la HPPD qui est une enzyme clef impliquée du sentier catabolique de la tyrosine (Naiki et al . 2002).

      4. Sous-famille des protéines liant les séquences stimulatrices de type CCAAT ( CCAAT/Enhancer Binding Proteins , C/EBP). Tous ces facteurs de transcription contiennent un domaine de liaison à l’ADN et de dimérisation nommé bZIP ( basic-leucine zipper ). Cette sous-famille est composée des membres C/EBP-α, β, γ, δ, ε et ζ . Ces protéines forment des homo- ou des hétérodimères (Ramji and Foka 2002; Schrem et al. 2004). Ils reconnaissent des variantes de la séquence consensus A/GTTGCGC/TAAC/T (Ramji and Foka 2002). Les membres de cette famille sont impliqués dans la régulation des gènes humains de l’asparagine synthétase (Siu et al . 2001), du récepteur de l’insuline (Foti et al . 2003), du récepteur γ2 du proliférateur activé du péroxisome (P eroxisome Proliferator-Activated Receptor-γ , PPAR γ2) (Yang and Chow 2003) et du gène rétinal déhydrogénase de type 1 du rat (RALDH1) (Guimond et al . 2002).

      5. La famille GATA : Cette famille est appelée ainsi parce que ses membres se lient à la séquence A/TGATAA/G. Cette famille est divisée en deux catégories, d’une part la sous-famille GATA-1,2 et 3 et d’autre part la sous-famille GATA-4, 5 et 6. La première catégorie est exprimée principalement dans les lignées hématopoïétiques et la seconde dans les tissus comme le cœur, les gonades, les glandes surrénales et des intestins (Patient and McGhee 2002; LaVoie 2003; Tremblay and Viger 2003). En ce qui nous concerne, le facteur GATA-4 est le seul qui joue un rôle dans la régulation transcriptionnelle hépatique (Patient and McGhee 2002). En effet, il est le seul membre de cette famille dont la liaison au promoteur a été identifiée pour un gène hépatique murin de l’albumine (Bossard and Zaret 1998). Il a été démontré que GATA-4 joue un rôle dans la transcription du gène Hex avec l’aide de HNF-3 et de Sp1 (Denson et al . 2000). De plus, il joue un rôle dans la régulation d’un facteur de coagulation exprimé par le foie appelé facteur X (Hung et al . 2001).

La distribution tissulaire de la FAH humaine semble correspondre à l’expression d’un gène spécifique à un tissu. En effet, la FAH est détectée à une forte concentration dans le foie et dans les reins, et à de faibles niveaux dans la majorité des autres tissus (Kvittingen et al . 1983; Berger et al . 1987; Tanguay et al . 1990). Cependant, il a été rapporté que la séquence promotrice du gène humain de la FAH ne contient aucune boîte TATA, aucune boîte CAAT et contient 11 sites potentiels de liaison au facteur de transcription Sp1 (Labelle et al . 1993). Ces caractéristiques sont généralement associées aux gènes dont la transcription est ubiquitaire. Afin de réconcilier ces deux observations qui semblent contradictoires, nous avons entrepris d’étudier la région promotrice du gène de la FAH.

Dans un premier temps, nous avons utilisé la technique d’amplification rapide des extrémités 5’ des ADNc médiée par la ligation d’un adapteur d’ARN (5’ RLM-RACE ) afin d’identifier les sites d’initiation de la transcription (SIT) des ADNc de la FAH dans différents tissus. Dans le foie humain, tous les sites trouvés sont directement en amont de la séquence codante de la FAH, ce qui suggère que la région promotrice s’y trouve. Étonnamment, nous n’avons pas trouvé le site situé à –56 pb du codon de départ de la FAH identifié précédemment (Phaneuf et al . 1991).

Chez la souris, nous avons entrepris d’identifier les SIT dans le foie, le reins et le cerveau. Indépendamment du tissu étudié, nous avons retrouvé les mêmes SIT. Ceci suggère qu’il n’y a pas d’utilisation de promoteurs alternatifs pour expliquer la spécificité tissulaire de la FAH chez la souris.

L’analyse in silico des 2000 pb en amont du gène murin de la FAH révèle qu’il y a 10 sites potentiels de liaison au facteur de transcription Sp1. Étonnamment, il y aurait présence d’au moins deux boîtes CAAT en amont du gène, de deux de boîtes TATA ainsi que de nombreux sites de liaison pour les facteurs de la famille des HNF. De plus, l’alignement de la séquence promotrice du gène humain avec celle du gène de souris n’a pas permis de révéler la présence de régions d’ADN conservées. Ces données suggèrent que la région promotrice du gène murin de la FAH diffère quelque peu de celle de la FAH humaine, bien que l’organisation du gène de la fah est conservée entre ces deux espèces.

Afin de déterminer le promoteur basal de la FAH responsable de l’expression spécifique à un tissu chez la souris, nous avons cloné le gène rapporteur de la luciférase à une région contenant 1893 pb en amont du codon d’initiation de la traduction. Ceci a permis de procéder à la délétion en 5’ de cette région dans le dessein d’éliminer des sites potentiels de liaison à des facteurs de transcription. Des essais luciférase après transfection transitoire dans les cellules NIH3T3, HeLa et HepG2 suggèrent que la présence de 290 pb en amont du codon d’initiation permettent l’expression basale et constitutive du gène rapporteur dans tous ces types cellulaires. Malheureusement, ces essais n’ont pas permis de mettre en évidence la présence de régions d’ADN pouvant expliquer l’expression spécifique du gène dans un tissu.