Chapitre 5 Caractérisation d’une région d’intérêt (GLC1B)

Table des matières

Il fut déterminé que le branchon initial de la famille PR démontrait une intéressante possibilité de liaison du glaucome au locus de susceptibilité GLC1B identifié en 1996 par Stoilova et coll. (18). La région minimale associée à ce locus avait alors été établie à 11,2 cM grâce à des individus recombinants identifiés parmi les 6 familles de l’étude liées au chromosome 2cen-q13 ( GLC1B ).

Le noyau initial de la famille PR ne permettait pas de restreindre l’intervalle associé à cette région, puisque les individus atteints portant un haplotype commun ne recombinaient pas à l’intérieur de l’intervalle déjà rapporté. Dans le but de parvenir à délimiter une région minimale de susceptibilité associée au glaucome affectant la famille PR, nous avons entrepris le recrutement de plusieurs membres additionnels de ce même branchon ainsi que l’inclusion de nouveaux branchons comportant des individus atteints de glaucome reliés à cette famille par un ancêtre commun.

Dû à la présence d’un effet fondateur typique des familles canadiennes françaises du Québec, la famille PR avait le potentiel d’être considérablement élargie. Ainsi, des recherches généalogiques effectuées auprès de certains membres de la famille ont permis de retracer deux autres branchons reliés à ce pedigree avec des antécédents de glaucome (Figure 33 et Figure 34). Dans un premier lieu, la descendance de l’individu identifié arbitrairement PR043, né en 1839, nous a permis de recruter deux cas additionnels de glaucome ainsi qu’un cas d’HTO (PR241, PR242 et PR246, voir Figure 33).

Un total de 16 individus ont été additionnés au noyau initialement prélevé. Les symboles sont selon la légende décrite à la Figure 23.

Ces individus partageaient le même arrière-grand-père que l’individu affecté le plus âgé du branchon initial, PR011, âgé de 81 ans. De plus, un ancêtre commun né en 1707, PR052, a permis le recrutement de deux autres individus affectés, PR080, atteint de GPAO et PR130, atteint d’HTO (Figure 34).

L’ancêtre commun PR052 était l’arrière-grand-père au 4e degré de l’individu PR080 et au 5e degré de l’individu PR011. Un quelconque défaut génétique commun reliant le glaucome de ces deux individus laissait envisager un haplotype partagé très court, ces deux individus faisant partie de deux branchons se divisant dès la génération qui suivit PR052. Ce second branchon ajouté au nucléus initial avait donc le potentiel de restreindre considérablement l’intervalle associé à cette région de susceptibilité au glaucome, GLC1B . D’autre part, le glaucome présent chez cette partie éloignée de la famille PR pouvait également provenir de bien d’autres origines qu’un gène défectueux commun disséminé à la fois chez le nucléus initial et celui de ces individus reliés à un lointain ancêtre né en 1707.

Suite à l’extension du pedigree PR, un total de 66 individus ont été prélevés chez cette famille et leurs diagnostics oculaires mis à jour annuellement depuis leur recrutement (Tableau 12).

Un total de 26 individus ont été additionnés au noyau initial et à la première extension du pedigree. Ces individus partageaient un ancêtre commun né en 1707. Les symboles sont selon la légende décrite à la Figure 23.

La première extension du pedigree PR a permis le génotypage de 11 individus supplémentaires liés au branchon initial par l’ancêtre commun PR043, né en 1839. Le génotype de ces individus et de ceux initialement testés a été étendu à un total de 12 marqueurs polymorphiques, de type microsatellite « CA », couvrant 8,5 cM de l’intervalle GLC1B (Figure 35).

L’haplotype commun à tous les individus atteints du branchon initialement testé ne fut pas retrouvé dans son intégrité chez les 2 patients souffrant de glaucome et la personne atteinte d’HTO recrutés dans l’extension du pedigree. Cependant, quatre marqueurs contigus situés dans la portion télomérique « p » de l’haplotype commun étaient partagés par les deux individus atteints de glaucome de l’extension : PR241 et PR242. Considérant la provenance de cet haplotype partageant 4 marqueurs avec l’haplotype retrouvé chez les individus atteints du branchon initial, on peut déduire qu’il devait fort probablement provenir de l’individu PR239, la mère de PR241 et PR242, puisque ce même haplotype fut aussi caractérisé chez l’individu PR248 (Figure 35), le cousin de PR241 et PR242. L’individu PR239 n’ayant pu être inclus dans cet étude, il fut toutefois confirmé auprès de sa famille qu’il était atteint de glaucome.

Les symboles sont selon les légendes décrites aux Figure 23 et Figure 26. Douze marqueurs microsatellites situés dans la région du locus GLC1B ont été génotypés (voir boîte). Une région de l'haplotype potentiellement commune à l'haplotype initialement décrit est identifié par une boîte noire au contour pointillé (branchon 1839).

Dans l’éventualité où les individus de ce branchon extensionné de la famille PR auraient effectivement hérité d’une portion de l’haplotype retrouvé chez le branchon initial, le génotypage de nouveaux marqueurs positionnés à l’intérieur de la région délimitée par les quatre marqueurs communs fut entrepris. L’intervalle génétique entre les deux marqueurs bordant cet haplotype « similaire » couvrait une distance de 3,8 cM selon la carte génétique de Généthon (93). Des marqueurs de type « polymorphisme de simple nucléotide », plus couramment connus sous l’appellation « SNP », furent utilisés pour augmenter l’informativité de la signature génétique de cette région chez la famille PR. Ainsi, 3 marqueurs SNP ont initialement pu être utilisés dans la détermination des allèles familiaux de cette région, leur positionnement étant basé sur la carte génétique « GeneMap 99 », disponible à l’époque aux ressources publiques du NCBI (URL : http://www.ncbi.nlm.nih.gov/). Les SNPs stsg30406, IB-589 et stSG15654 permettaient donc l’obtention d’un haplotype plus informatif associé à la région bordée par les microsatellites D2S2232 (a341xh1) et D2S2181 (a190zd1). Les marqueurs SNPs furent génotypés sur deux petits nucléi de la famille PR et phasés avec les quatre autres marqueurs déjà caractérisés. Un nucléus provenait du branchon initial (individu clef :PR001) et l’autre de la première extension de la famille (individu clef : PR242) (Figure 36).

La caractérisation de ces marqueurs additionnels n’a pas permis de discriminer l’haplotype ségrégué par les individus PR001 et PR242, favorisant ainsi la possibilité que les individus atteints de glaucome chez ces deux branchons de la famille partagent le même haplotype dans cette région chromosomique. Si tel était le cas, la région associée au glaucome GLC1B passerait de 11,2 cM (18) à 5,7 cM selon la carte des microsatellites de Généthon (93).

Les symboles sont selon les légendes décrites aux Figure 23 et Figure 26. Quatre marqueurs microsatellites et trois marqueurs "SNP" situés dans la région du locus GLC1B ont été génotypés (voir boîte).

Quatre individus rattachés au branchon initial de la famille PR par l’ancêtre né en 1707 ont également été génotypés sur une dizaine de marqueurs polymorphiques couvrant l’intervalle GLC1B (Figure 37). Puisque ce branchon ne comportait qu’un seul cas de GPAO et d’HTO, seulement 4 individus (2 asymptomatiques et 2 affectés) furent testés sur autant de marqueurs.

Un haplotype comprenant 4 marqueurs partageant le même allèle que l’haplotype retrouvé chez le branchon initial a pu être observé chez l’individu atteint de GPAO, PR080, ainsi que son fils atteint d’HTO, PR130 (Figure 37, voir aussi Tableau 13). Les marqueurs D2S388, D2S2216, D2S2181 et D2S2159 couvraient un intervalle génétique maximum de 3,8 cM selon la carte Généthon (93).

Les symboles sont selon les légendes décrites aux Figure 23 et Figure 26. Dix marqueurs microsatellites situés dans la région du locus GLC1B ont été génotypés (voir boîte). L'haplotype commun chez les deux individus atteints du branchon 1707 est caractérisé par une boîte blanche. Une région de l'haplotype potentiellement commune à l'haplotype initialement décrit chez la famille PR est identifié par une boîte noire au contour pointillé.

Avant d’entreprendre l’addition d’un plus grand nombre de marqueurs polymorphiques situés dans la région potentiellement commune chez tous les individus atteints de glaucome du pedigree PR, la construction d’une carte physique permettant d’ordonner plus précisément ces futurs marqueurs ainsi que ceux déjà caractérisés dans l’intervalle d’intérêt fut entamée. Ainsi, le positionnement de marqueurs déjà testés, de nouveaux marqueurs polymorphiques ainsi que des séquences « STSs » ( sequence- tagged sites ) incluant des « ESTs » ( expressed sequence tags ) permettraient de : 1) valider les haplotypes observés en confirmant un ordre des marqueurs; 2) d’augmenter le nombre de marqueurs confirmant ou infirmant l’haplotype commun observé et; 3) d’identifier des gènes candidats positionnés dans l’intervalle d’intérêt.

La construction d’une carte physique couvrant entièrement l’intervalle minimal de 5,7 cM contenu par le locus GLC1B identifié à l’aide de la première extension du pedigree PR requerrait l’utilisation de chromosomes artificiels de levure (YACs). Développée en 1987 (99), cette technique de clonage de larges segments d’ADN humain dans des cellules d’utilisation simple, comme les levures, rendait possible, lorsque combinée à la technique PCR ( polymerase chain reaction ), de positionner les STSs et marqueurs polymorphiques d’une région chromosomique donnée.

Les YACs contenus dans les contigs 2.6, 2.7 et 2.8 du Whitehead Institute Center for Genome Research (WICGR) (URL : http://www-genome.wi.mit.edu/cgi-bin/contig/phys_map), Cambridge MA, ont été cultivés pour en extraire une quantité suffisante d’ADN pour effectuer les test de positionnement par PCR. Les YACs contenus dans ces trois assemblages permettaient de couvrir une région chromosomique s’étendant de D2S2161 à D2S113, bordant l’intervalle génétique de 5,7 cM.

Les YACs déjà caractérisés par le WICGR dans les contigs 2.6, 2.7 et 2.8 n’ont pu être recoupés entre eux (Figure 38). Ainsi, la carte physique s’est avérée contenir deux « trous », aucun YAC de l’un de ces contigs n’« allumant » par PCR un marqueur également retrouvé dans un autre contig. Ces régions, non clonées, à l’intérieur des différentes souches de levures utilisées, se trouvaient, par rapport aux marqueurs polymorphiques Généthon, entre D2S2216 et D2S388, et entre D2S2181 et D2S113. Les marqueurs polymorphiques D1S2154 et D2S2159, génotypés chez la famille PR, n’ont pu être positionnés sur la carte puisqu' aucun YAC n’est parvenu à amplifier leurs séquences d’ADN par PCR.

De nombreux marqueurs STSs utilisés dans la construction de la carte physique ont été testés pour leur contenu en polymorphismes de simple nucléotide (SNPs).

De cette façon, plusieurs marqueurs de ce type ont été identifiés dans l’intervalle d’intérêt, rendant possible le génotypage de ces marqueurs chez la famille PR. Le positionnement de ceux préalablement testés (STSG-30406, IB589 et STSG-15654, voir Figure 39) a pu également être confirmé. Des marqueurs polymorphiques de type répétitions GATA ont aussi été identifiés dans l’intervalle couvert par la carte physique: GATA112e03, GATA82e09 et GATA6g02. Le génotypage de ces marqueurs chez la famille PR fut effectué. Le marqueur GATA6g02 (D18S549) a toutefois été retiré du génotype de la famille: en plus de provoquer des difficultés au phasage des allèles de la famille, ce marqueur avait aussi été lié au chromosome 18 (Figure 39). Les données de génotypage obtenues de GATA112e03 et GATA82e09 ont permis de discriminer l’haplotype potentiellement commun retrouvé chez les individus atteints de la première extension de la famille de celui présent chez ceux des branchons ajoutés (Tableau 13).

Les clones YACs et le contig auquel ils appartiennent sont identifiés à la gauche de la figure en plus de leur longueur en kilobases (kb) d'ADN. Les différents marqueurs testés sont identifiés dans la portion supérieure et dans l'ordre déduit. Un "X" définit l'amplification positive par PCR du marqueur testé sur le clone correspondant (suivre coordonnées du grillage). Deux "trous" ont été rapportés suite à la non-superposition des marqueurs testés dans ces régions.

Les boîtes situées dans la portion gauche de la figure indiquent l'étendue de l'intervalle génétique déjà rapporté au locus GLC1B comparée à l'intervalle potentiellement identifié chez la famille PR et celle couverte par la construction d'une carte physique de YACs. Les marqueurs microsatellites de type CA sont positionnés selon la carte génétique de Généthon (93) et ceux de type GATA sont positionnés selon les données du WICGR. Les distances indiquées sont en centiMorgans (cM). La boîte dans la partie droite de la figure indique les marqueurs de type SNP testés dans la région couverte par la carte physique où ceux qui se sont révélés polymorphiques chez le pedigree PR sont marqués d'un astérisque.

Les allèles relatifs identifiés chez chaque personne étaient basés sur la longueur du plus court allèle de l’individu référence du Centre de l’Étude du Polymorphisme Humain (CEPH), identifié M134702.

Des fréquences alléliques concernant la plupart des marqueurs testés dans l’intervalle GLC1B ont pu être établies utilisant les données recueillies chez toutes les familles québécoises investiguées, incluant les conjoints recrutés parmi celles-ci (Tableau 13). Ces estimés de fréquences alléliques ont permis d’observer si les allèles des marqueurs constituant les haplotypes potentiellement communs des extensions de 1839 (1ère) et 1707 (2ème) étaient communs chez la population québécoise. Ainsi, il fut observé que les allèles de D2S388 et D2S2216, communs à l’haplotype initial chez les deux extensions, avaient chacun une fréquence allélique de 32%. De la même façon, les allèles de D2S2154 et D2S2159, communs à l’haplotype initial chez l’extension de 1707, avaient, respectivement, des fréquences de 73% et 47%.

Ces données, combinées au génotypage des marqueurs GATA discriminant les haplotypes des trois branchons de la famille, appuyaient difficilement l’argument voulant que les individus atteints des branchons extensionnés soient également liés au locus GLC1B . D’un autre côté, on pouvait également mettre en doute la liaison du branchon initial de la famille au locus GLC1B , d’autres individus atteints d’une partie plus éloignée de la famille ne partageant vraisemblablement pas d’haplotype commun sur cette région chromosomique.

Suite à l’identification d’un haplotype retrouvé chez tous les individus atteints du noyau initial de la famille PR, deux élargissements du recrutement de la famille ont été entrepris dans le but d’y retrouver ce même haplotype. Étant donné l’éloignement « familial » des branchons extensionnés (liés respectivement par des ancêtres nés en 1839 et 1707), cet haplotype pouvait vraisemblablement partager une région commune plus courte suite à des évènements de recombinaison. Cette région commune, si retrouvée également chez les individus atteints des branchons extensionnés, pourrait contenir un gène associé au GPAO adulte. Or, suite à l’augmentation du nombre de marqueurs polymorphiques testés et à l’établissement d’une carte physique confirmant/infirmant l’ordre de ces marqueurs, un tel « haplotype commun » chez tous les individus atteints de la famille PR ne semblait pas exister.

Dans le but de vérifier l’hypothèse qu’il n’y ait pas d’haplotype d’une origine commune, ne serait-ce qu’entre deux des trois branchons de la famille, le Projet (de séquençage) du Génome Humain (HGP) fut utilisé comme un outil additionnel intéressant pour valider le positionnement des marqueurs testés. L’ordre des marqueurs de cette région était souvent contradictoire, selon les différents organismes diffusant publiquement des cartes génomiques (Figure 40). La région centromérique du chromosome 2 était possiblement liée à plusieurs de ces divergences de positionnement et à certaines régions non couvertes par des séquences clonées (trous). Un repositionnement, si justifié, pourrait permettre la reconstruction d’un haplotype partagé sur une plus longue région chromosomique, augmentant la probabilité d’une origine commune des allèles observés dans cette portion de GLC1B .

Utilisant le «  Human Genome Browser Gateway  » de l’Université de Californie à Santa Cruz (UCSC) (URL : http://genome.ucsc.edu/cgi-bin/hgGateway), la position et l’ordre de chaque marqueur pouvaient être validés selon les quatre derniers assemblages («  Build  ») du génome humain (#27 à #30). La construction la plus récente représentait une séquence du génome humain complétée à plus de 90%. Parmi les séquences disponibles, ~85% étaient considérées comme complétées et de haute précision, et l’autre 15% comme un brouillon à interpréter avec réserve (séquences en morceaux, non-ordonnées). Les séquences assemblées provenaient de chromosomes artificiels de bactéries (BACs), 5 à 10 fois plus petits que les YACs, mais beaucoup plus stables. Ils contenaient, de façon générale, de 100 à 200 kb d’ADN.

La séquence correspondante au locus GLC1B était presque entièrement constituée de séquences complétées, sauf pour quelques petits segments à l’état de brouillon. Le plus important était d’une longueur d’environ 300 kb entre les mégabases 87 et 88 du chromosome.

Cependant, une région d’environ 3 Mb (90,17-93,20 Mb) n’est pas couverte par les contigs de séquence des constructions. Cet intervalle correspondait à la région centromérique du chromosome 2 (Figure 41 et Figure 42).

Le positionnement des marqueurs de type GATA et CA testés au locus GLC1B selon la carte intégrée de Southampton, la carte d'hybrides d'irradiation de Stanford-SHGC, la carte Génétique de Marshfield, la carte génétique de Généthon et le positionnement obtenu par la carte physique établie dans ce laboratoire. La divergence des positions selon chaque carte peut être suivie par le code de couleurs attribué à chaque marqueur.

source: National Center for Biotechnology Information (NCBI), URL: http://www.ncbi.nlm.nih.gov/cgi-bin/Entrez/maps.cgi?org=hum&chr=2.

L'intervalle couvrant les mégabases 84 à 105 du chromosome 2 est affiché selon les données de l'assemblage #30 (Juin 2002) du HGP. Les rectangles bleus indiquent les séquences complétées et regroupées en méga-contigs (NT). Les régions en jaune représentent des assemblages incomplets.

source: National Center for Biotechnology Information (NCBI), URL: http://www.ncbi.nlm.nih.gov/cgi-bin/Entrez/maps.cgi?org=hum&chr=2.

L'intervalle couvrant les mégabases 84 à 105 du chromosome 2 est comparé au positionnement des microsatellites de la carte Généthon. Les rectangles bleus indiquent les séquences complétées et regroupées en méga-contigs (NT). Les régions en jaune représentent des assemblages incomplets. La position des microsatellites est définie en centiMorgans (cM).

L’assemblage #30 (Juin 2002) était la plus complète et récente des versions utilisées pour valider l’ordre des marqueurs polymorphiques du locus GLC1B. Cette version contenait les informations de positionnement sur tous les marqueurs testés et s’est avérée, à un marqueur près, à confirmer presqu’entièrement l’ordre des marqueurs établi par la carte physique de YACs (Tableau 14).

Les marqueurs GATA112e03 et 82e09, consolidés dans leur position et leur ordre dans l’intervalle d’intérêt, confirmaient un haplotype discriminatoire pour cette région entre chacun des branchons de la famille PR.

En plus de leur utilité dans la construction des cartes génomiques, les séquences des BACs utilisés pour cette fin fournissaient un outil facile d’accès et rapide pour la découverte de marqueurs polymorphiques dans une région d’intérêt. Il était possible d’identifier des régions potentiellement polymorphiques en utilisant un programme informatique relativement simple de recherche de répétitions sur une séquence de nucléotides de large taille comme celle contenue dans les BACs (communément appelé « PCR électronique » ou « e-PCR »). De cette façon, la séquence de plusieurs BACs positionnés dans l’intervalle d’intérêt a été ratissée pour y trouver des motifs de répétitions de type « CA » (Tableau 15).

Chacun des BACs scrutés par PCR électronique avait initialement été sélectionné selon le positionnement de ceux-ci dans la carte d’hybrides irradiation « G4 » (cR = 3000) de GenMap99 (ressource Internet non disponible à ce jour). Depuis cette sélection, des BACs repositionnés à l’extérieur de la région d’intérêt comme AC017002 (~5 Mb q-télomérique à GLC1B ) et AC016573 (chr 5) se sont avérés inutilisables. Malgré cela, près de 50% (6/13) des régions intéressantes identifiées par simple « e-PCR » se sont effectivement révélées polymorphiques (Tableau 15). L’addition de marqueurs polymorphiques découverts par ce moyen, ainsi que ceux de type SNP et GATA également ajoutés aux marqueurs initialement testés, permettait d’avoir un haplotype serré, caractérisant précisément la ségrégation de la région D2S2181-D2S113 chez la famille PR (Figure 43).

Tableau 14. Ordre des marqueurs polymorphiques du locus GLC1B caractérisés chez la famille PR selon le Projet du Génome Humain (HGP)

Marqueurs

(ordre basé sur la carte physique YACs établie dans notre laboratoire)

Type

Construction ( Build ) du « HGP »

Août 2001

#27

ordre (Mb)

Déc. 2001

#28

ordre (Mb)

Avril 2002

#29

ordre (Mb)

Juin 2002

#30

ordre (Mb)

D2S2161 (a126zb1)

CA

ND

ND

1- 88,57

1- 85,18

VAMP5

SNP

1- 90,88

3- 86,82

2- 89,10

2- 85,71

D2S2232 (a341xh1)

CA

2- 91,06

4- 87,00

3- 89,28

3- 85,89

D2S388 (333vh5)

CA

5- 91,69

2- 86,10

4- 89,36

4- 85,97

stSG30406

SNP

4- 91,69

1- 86,10

5- 89,36

5- 85,97

D2S1331 (GATA112e03)

GATA

3- 91,19

5- 87,53

6- 89,87

7- 86,48

IB589

SNP

ND

ND

ND

6- 86,35

D2S1783 (GATA82e09)

GATA

ND

ND

ND

8- 86,82

SGC33869

SNP

6- 92,08

6- 87,95

7- 90,29

9- 86,90

D2S2216 (a286zb5)

CA

7- 93,10

7- 88,18

8- 91,56

10- 87,96

D2S2181 (a190zd1)

CA

8- 93,32

8- 88,45

9- 91,83

11- 88,23

stSG15654

SNP

9- 94,04

14- 98,10

10- 92,20

12- 88,60

D2S2154 (a115za5)

CA

10- 98,41

9- 91,88

11- 93,46

13- 93,45

D2S2159 (a125yg1)

CA

11- 99,05

19- 130,36

12- 93,96

14- 93,95

D2S113 (052xb4)

CA

12- 100,33

10- 93,20

13- 98,26

15- 95,15

D2S2222 (a303wf5)

CA

13- 101,03

12- 94,34

14- 99,28

16- 96,18

D2S2175 (a153zg5)

CA

14-101,80

11- 93,86

15- 99,77

17- 96,67

D2S2209 (a246xe9)

CA

15- 104,32

13- 97,27

16- 102,21

18- 99,10

D2S2264 (b277ze1)

CA

16- 105,55

15- 101,29

17- 103,39

19- 100,28

D2S2356 (a048ya9)

CA

17- 106,64

16- 102,38

18- 104,47

20- 101,37

D2S135 (172xc3)

CA

18- 108,58

17- 104,34

19- 106,48

21- 103,38

D2S2229 (a338wd5)

CA

19- 109,42

18- 105,18

20- 107,29

22- 104,19

Les symboles sont selon les légendes décrites aux Figure 23 et Figure 26. Neuf marqueurs microsatellites de type CA, deux de type GATA et huit marqueurs de type SNP situés dans la région du locus GLC1B ont été génotypés (voir boîte). L'haplotype commun retrouvé chez le nucléus initialement testé chez la famille est décrit par une boîte noire. Cet haplotype n'est pas présent chez les autres individus atteints de glaucome du branchon 1839.

La région chromosomique représentant l’intervalle complet du locus de susceptibilité au glaucome GLC1B avait été associée aux bandes 2cen-q13 (18). Le projet de séquençage du génome humain permettait toutefois d’affirmer que l’intervalle génétique de 11,2 cM était en fait associé à une région représentant environ 20 Mb (84,18-104,19 Mb) couvrant les bandes 2p11.2-q13. Le nombre de gènes identifiés dans cette région (114 gènes, selon l’assemblage de juin 2002 du HGP), beaucoup trop élevé pour envisager le séquençage systématique de ceux-ci, justifiait la recherche d’un haplotype idéalement beaucoup plus court. Même si un tel haplotype n’a pu être retrouvé chez les branchons extensionnés de la famille, certains gènes/protéines aux fonctions et localisations tissulaires probantes ont été identifiés et testés durant l’évolution de ce projet (Tableau 16).

Tableau 16. Protéines encodées par quelques gènes candidats du locus GLC1B

Protéine (# acides aminés)

Positionnement chromosomique

(Juin 2002, #30)

Fonction (si connue) et particularités

Expression dans

tissus oculaire

(Unigene)

VAMP8 (100 a.a.)

vesicle associated membrane protein

(endobrevin)

2p11.2

(85,70 Mb)

Transport vésiculaire non-sélectif

(associée aux strucures vésiculaires péri nucléaires des compartiments précoces de l’endocytose)

nerf optique

VAMP5 (116 a.a.)

vescile associated membrane protein

(myobrevin)

2p11.2

(85, 71 Mb)

Transport vésiculaire non sélectif

(protéine membranaire intrinsèque des petites vésicules synaptiques, associée à la myogénèse)

nerf optique

trabéculuma

irisa

LOC164828 (570 a.a.)

similaire à FOXI1 chez l’humain

2p11.2

(88,25 Mb)

Fonction inconnue

(contient un domaine forkhead qui la lierait à la famille des facteurs de transcription de type forkhead )

ND

DKFZP564L2423 (348 a.a.)

similaire à glycoprotéine open reading frame-8 du réticulum endoplasmique chez l’humain

2p11.1

(93,29 Mb)

Fonction inconnue

(autre homologie : 55% identique à Vip36 (famille des lectines), une protéine membranaire intrinsèque des vésicules chez le chien)

épithélium pigmentaire rétinien (EPR)

œil (fœtus)

choroïde

FLJ21281 (717 a.a.)

similaire à centromere protein E (CENP-E) chez l’humain

2q11.2

(94,54 Mb)

Fonction inconnue

(autre homologie : 45% similaire à la chaîne lourde myosine-II chez la drosophile, la région homologue correspond à l’extrémité C-terminale myosin tail )

rétine (fœtus)

rétine

cornée

ACTR1B (376 a.a.)

Actin related protein-1 homolog B

(ß-centractine)

2q11.2

(94,36 Mb)

Protéine du complexe de la dynactine

(protéine de structure impliquée dans le transport via les microtubules)

nerf optique

trabéculuma

irisa

œil (fœtus)

aExpression du gène vérifiée par RT-PCR dans le cours de ce projet.

Le gène ACTR1B (OMIM #605144) code pour une protéine de 376 acides aminés communément appelée ß-centractine, une isoforme rarissime (ratio α:β = 15:1) de la centractine, une protéine possédant un domaine de type «  actin fold » l’apparentant à l’actine (53 % d’identité) (Figure 44).

Ce domaine, conservé chez un grand nombre de protéines, est lié, chez les protéines de type « ARP » ( actin related protein ), à une fonction de motilité cellulaire en association avec des protéines motrices de type myosine. Plus spécifiquement, l’isoforme ß de la centractine (90% identique à la forme α) est exprimée dans le cytosol comme composante du complexe de la dynactine, un complexe activateur du mécanisme de motilité des vésicules généré par la dynéine (Figure 45).

source adaptée de: Holleran, E. A, Karki, S. et Holzbaur, E. L. (1998) The role of the dynactin complex in intracellular motility. Int. Rev. Cytol. 182 , 69-109.

La structure tridimensionnelle de l'actine cristallisée (A) est comparée à une prédiction de structure de la centractine (B). La séquence peptidique de l'actine est 53% identique à celle de la centractine.

source: Gulesserian, T., Hwan Kim, S., Fountoulakis et M., Lubec, G. (2002) Aberrant expression of centractin and capping proteins, integral constituents of dynactin complex, in fetal down syndrome brain. Biochemical and Biophysical Research Communications 291 , 62-67.

Schéma du complexe de la dynactine qui est constitué d'au moins sept polypeptides différents co-sédimentant à 20S. Ce complexe comprend les sous-unités p150Glued, centractine (p45), la dynamitine (p50), p37, p32 et les sous-unités non-caractérisées p62 p24 et p27. Les sous-unités de centractine serviraient de liens avec les organelles.

L'expression du gène ACTR1B dans le nerf optique et l’œil fœtal (voir Unigene, URL: http://www.ncbi.nlm.nih.gov/UniGene/), en plus de son assignation aux bandes 2q11.1-q11.2 par hybridation in situ (100) (avant même la confirmation de cette position par le HGP), en faisaient un gène candidat très intéressant.

Dans le but de vérifier si ce gène était exprimé dans d’autres tissus d’intérêt comme l’iris et, surtout, le trabéculum, des essais de transcription "reverse" (RT-PCR : reverse transcription polymerase chain reaction ) sur du cDNA obtenu d’ARNm purifié à partir de tissus oculaires humains prélevés post-mortem (~12-36 h) ont été effectués (Figure 46).

Ainsi, l’amplification du fragment STS WI-13619, situé dans la portion 3’ non codante du gène, fut possible, autant sur du cDNA provenant d’ARNm d’iris que de trabéculum, argumentant en faveur d’une expression de ce gène dans ces tissus.

La séquence génomique de ce gène n’étant pas publiquement disponible à ce moment, un total de 32 amorces ont dû être testées pour parvenir à l’amplification de ses régions exoniques. Par séquençage non automatisé aux isotopes 33P, les segments amplifiés ont révélé que la séquence exonique de ACTR1B était entrecoupée d’un minimum de 5 introns. Il fut par la suite déterminé que la séquence génomique de ACTR1B comprenait 11 exons s’étendant sur une distance génomique d’environ 8 kb, les portions séquencées du gène n’ayant révélé que 5 des 10 introns existants (Figure 47).

L’ARNm extrait de tissus frais de trabéculum et d'iris était transcrit en ADNc par reverse-transcription . À partir de cette matrice d'ADNc, un essai PCR standard avec les amorces WI-13619 amplifiant une portion 3' non codante du gène était réalisé. Les amplifiats étaient résolus par gel d'agarose 2,5%.

Les individus PR001 (individu portant l’haplotype initialement associé au locus GLC1B chez les individus atteints du branchon initial) et PR007 (un conjoint de cette famille) ont été séquencés sur ce gène. Un variation intéressante fut identifiée dans la région homologue à l’actine chez l’individu porteur de l’haplotype d’intérêt (PR001). Ce changement dans la séquence engendrait une modification de l’acide aminé à la position 143, substituant une alanine pour une valine (A143V ou Ala143Val). Pour vérifier si cette variation ségréguait avec l’allèle partagé par les individus atteints de la famille PR, le séquençage de cette variation fut étendu à un total de 6 porteurs de l’haplotype commun chez le branchon initial (PR001, PR006, PR011, PR013, PR017, PR021) et 5 conjoints de la famille (PR002, PR007, PR012, PR014, PR141). La variation Ala143Val fut également retrouvée chez les 5 porteurs de l’haplotype et chez aucun des conjoints testés, confirmant que cette variation ségréguait effectivement avec l’haplotype commun.

Puisque l’extension du recrutement de la famille PR était alors en majeure partie complétée, les individus atteints des branchons de 1839 et 1707 ont également pu être testés concernant la variation A143V. Si, effectivement, les individus atteints des branchons éloignés possédaient également cette variation, cela serait un bon argument pour suggérer l’existence d’un haplotype partagé chez tous les individus atteints de la famille PR et cela ferait du gène ACTR1B un excellent candidat à être relié au GPAO adulte.

Les individus PR241 et PR246 (extension 1837; PR242 n’était pas encore recruté), PR080 et PR130 (extension 1707) ainsi que 5 conjoints additionnels furent ainsi séquencés sur le segment amplifié contenant la région de la variation A143V. Aucun de ceux-ci ne s’est avéré posséder la variation. Dans l’éventualité où il n’y aurait aucun haplotype partagé par les trois branchons recrutés chez la famille PR, comme les données de génotypage semblaient le confirmer (voir partie 4.2), il fallait considérer la possibilité qu’ ACTR1B soit toujours un gène candidat pour le locus GLC1B .

La première mutation d’une sous-unité de la dynactine a été identifiée en 1935 par Plough et Ives (aucune référence disponible, voir revue (101)), celle-ci étant un allèle dominant conférant un phénotype résultant en une formation aberrante de l’œil et des lobes optiques chez la Drosophile ( Drosophila Melanogaster ). Cette mutation est, sur la protéine aujourd’hui nommée p150 Glued , l’équivalent de DCTN1 chez l’humain, la plus grosse sous-unité de la dynactine. Une étude subséquente a démontré que cette mutation était, en fait, une protéine p150 Glued tronquée dans sa partie C-terminale suite à l’insertion d’un transposon dans la séquence codante (102). Cette insertion codait pour un arrêt prématuré de la transcription résultant en la délétion d’un domaine hautement conservé situé en C-terminale. Il a été démontré que ce domaine hautement conservé était requis pour l’association de p150 Glued à la centractine (103) (Figure 48).

source: Holleran, E. A, Karki, S. et Holzbaur, E. L. (1998) The role of the dynactin complex in intracellular motility. Int. Rev. Cytol. 182 , 69-109.

Diagrammes rectangulaires représentant les domaines d'interaction des polypeptides de la dynactine. La portion N-terminale de la sous-unité p150Glued possèderait un domaine de liaison aux microtubules (MT). La portion centrale de la protéine p150Glued (a.a. 152-811) permettrait une association avec la chaîne intermédiaire de la dynéine alors que la portion C-terminale possèderait un motif chargé positivement KKEK possiblement responsable de la liaison à la centractine. Le polypeptide p135 est un isoforme de p150Glued obtenu par épissage alternatif. La centractine (p45) contiendrait cinq motifs formant une pochette de liaison aux nucléotides appelée " actin fold ". Ces régions sont, phosphate 1 (a.a. 10-33), connectrice 1 (134-153), phosphate 2 (155-175), adénosine (295-326) et connectrice 2 (333-357).

Des analyses structurales de la centractine ont révélé beaucoup de similitudes avec l’actine. La plupart des résidus conservés chez la centractine (53%) sont répartis dans les régions de l'actine de liaisons aux nucléotides et aux cations. Ces régions correspondaient à cinq régions distinctes de l’actine constituées d’un domaine de liaison à l’adénine, deux régions connectrices et deux régions de liaison au phosphate formant une pochette de liaison à l’ATP en se repliant nommée « pli actine » ( actin fold ) (104, 105). Une modélisation moléculaire prédisant un modèle tridimensionnel du monomère de centractine a été réalisée (101). Le modèle résultant prédisait une topologie globale très similaire à celle de l’actine. Seize (16) des 17 résidus de l’actine liant nucléotides et cations étaient conservés chez la centractine selon ce modèle. De plus, ce modèle révélait que les résidus 137-144 de l’actine étaient conservés, autant en séquence qu’en structure, chez la centractine (Figure 49).

Ces résidus, chez l’actine, forment une hélice-α qui sert de « penture » permettant aux deux moitiés de la molécule de lier les nucléotides et de les relâcher (106, 107). Ces huit résidus de l’actine ont leur équivalent chez les résidus 142 à 149 de la centractine, le segment Q A VLSLYA étant identique chez les deux protéines. Le résidu alanine 143 de la ß-centractine s’est avéré être le résidu le plus souvent conservé lorsqu’on compare l’utilisation des acides aminés de ce motif critique du domaine actin fold chez un total de 254 protéines reliées à l’actine (Figure 50).

Puisque la variation A143V de la β-centractine rencontrée chez les individus atteints du branchon initial de la famille PR était située dans un domaine potentiellement critique de la protéine, la région correspondante à cette variation chez un plus grand nombre d’individus atteints de glaucome ainsi que chez des individus cliniquement normaux a été séquencée. Un total de 84 individus non-reliés atteints de glaucome ainsi que 55 individus investigués comme cliniquement normaux (âge moyen : 63 ans) ont été séquencés pour vérifier la présence de cette variation. Plus de 15.5% (13/84) des individus atteints testés portaient la variation A143V, tandis que 12.7% (7/55) des individus exempts de toute maladie oculaire en étaient également porteurs.

source adaptée de: Kabsch, W. et Holmes, K. C. (1995) The actin fold. FASEB J., 9, 167-174.

Les premiers et derniers acides aminés de chaque hélice alpha et feuillet bêta sont indiqués. Les portions non-ombragées de la protéine sont spécifiques à l'actine. L'équivalent de la région connectrice 1 (C1) de la centractine (a.a. 137-144 de l'actine) est identifée par une accolade.

Pourcentage d'utilisation des sept acides aminés du motif retrouvé chez la ß-centractine et conservé chez la famille des protéines reliées à l'actine. Un total de 254 séquences en acides aminés sur ce motif de différentes protéines reliées à l'actine chez plusieurs eucaryotes uni- et multicellulaires ont été comparées. La séquence QAVLSLYA de la ß-centractine est identique à plus de 90% sur chacun des acides aminés du motif.

Le gène VAMP5 (OMIM #607029) code pour une petite protéine de 116 acides aminés, nommée myobrévine, associée aux membranes des vésicules. Puisque la myociline (locus GLC1A ), responsable de glaucome, est une protéine sécrétée à l’extérieur de la cellule (71), toute protéine impliquée dans le processus de sécrétion extracellulaire était une candidate à considérer, comme ce fut le cas pour la β-centractine. La myobrévine fait partie de la famille des protéines membranaires intrinsèques nommées synaptobrévines, ancrées dans les membranes des petites vésicules synaptiques se spécialisant dans le relargage Ca2+-dépendant de neurotransmetteurs par exocytose.

L’expression du gène VAMP5 chez les tissus de l’iris et du trabéculum a pu être vérifiée par RT-PCR sur des extraits d’ARNm purifiés à partir de tissus prélevés sur des yeux humains recueillis post-mortem . L’amplification d’un segment d’environ 150 pb située dans la région codant pour la partie N-terminale de la protéine semblait, malgré quelques traces de contamination génomique, confirmer l’expression de ce gène dans l’iris et le trabéculum (Figure 51).

La séquence génomique de VAMP5 n’étant pas publiquement disponible à ce moment de l’étude, un total de 31 amorces ont dû être utilisées pour mettre au point des essais PCR amplifiant les exons du gène. Ces essais ont révélé la présence d’un intron entrecoupant deux exons. Il fut, par la suite, déterminé que la séquence génomique de VAMP5 comprenait en fait 3 exons s’étendant sur une distance génomique d’environ 9 kb, le premier exon codant pour une région 5’ non traduite se terminant par le premier acide aminé de la protéine (Figure 52).

L’ARNm extrait de tissus frais de trabéculum et d'iris était transcrit en ADNc par reverse-transcription . À partir de cette matrice d'ADNc, un essai PCR standard amplifiant une portion du gène codant la partie N-terminale de la protéine était réalisé. Les amplifiats étaient résolus par gel d'agarose 2,5%. Chaque tissu a été testé en duplicata et contrôlé par un essai ne contenant pas d'enzyme.

Le séquençage du gène a été effectué entièrement à l’aide de la technique de séquençage non automatisé à l’isotope 33P. Après avoir analysé la totalité de la séquence codante du gène chez au moins un individu atteint du branchon initial de la famille PR et un conjoint de la famille, aucune variation codant pour un changement d’acide aminé ne fut détectée. Cependant, trois polymorphismes de type « SNP » ont pu être identifiés: un polymorphisme à la position 14 de la protéine (Asn14Asn) caractérisé par la transition d’une cytosine à une thymine, une transition d’adénosine pour une guanosine à 44 pb de l’extrémité 3’ de l’intron, ainsi qu’une transition d’adénosine pour une thymine à 21 pb du début de la séquence 3’ non codante. Ces trois SNPs ont, par la suite, été caractérisés chez tous les individus de la famille PR et été utilisés comme marqueurs génétiques (nommés VAMP5.1, 5.2 et 5.3 respectivement, voir Figure 43).

Un autre gène codant pour une protéine de la famille des protéines membranaires associées aux vésicules (VAMP) a récemment été positionné, VAMP8 , à environ 100 kb du gène VAMP5 . Ce gène code pour une petite protéine de 100 acides aminés nommée endobrévine. De par son expression dans le nerf optique (voir Unigene, URL: http://www.ncbi.nlm.nih.gov/UniGene/) et son implication dans les processus de sécrétion de la cellule, ce gène pourrait éventuellement être séquencé chez les individus atteints de la famille PR possédant l’haplotype lié au locus GLC1B . De plus, une récente communication par affiche rapportait un profil d’expression génique caractérisé à partir d’une banque d’ADNc tirée des cellules de trabéculum de 6 jeunes donneurs âgés entre 2 mois et 2 ans (108). Cette étude a pu catégoriser, par le séquençage systématique de chacun des plasmides purifiés de cette banque d’ADNc, un total de 1117 ESTs. La majorité (877/1117, 78,7%) des séquences ESTs détectées étaient associées à l’expression de gènes connus. L’un de ces gènes a été identifié comme étant VAMP8 , codant pour l’endobrévine.

L’ARNm d’un gène inconnu a récemment été rapporté comme codant pour une protéine de 570 acides aminés possédant une boîte de type «  forkhead  » la rattachant à la superfamille des facteurs de transcription de type « FOX » ( forkhead box ). Cette protéine partagerait la plus grande homologie avec la protéine FoxI1c de Xenopus laevis , et la protéine FOXI1 chez l’humain. La protéine humaine FOXI1, est aussi appelée FREAC6 ou FKHL10. Les gènes codant pour des facteurs de transcription de type forkhead sont critiques pour l’embryogénèse chez les mammifères, en particulier durant le développement du système nerveux. L’abolition ciblée du locus Fkhl10 chez la souris avait provoqué des symptômes communs à une dysfonction du vestibule auditif résultant, entre autres, en une perte très importante de l’ouïe (109). Une autre étude a, de plus, rapporté l’expression de FKHL10 exclusivement dans les tissus rénaux fœtal et adulte parmi les 15 tissus qu’ils avaient testés (aucun tissu de l’appareil auditif n’avait été testé) (110).

L’intérêt de la protéine inconnue LOC164828 résidait cependant beaucoup plus dans le fait qu’un facteur de transcription de type forkhead , FOXC1 (6p25), avait été associé à des malformations de l’œil comme le syndrome d’Axenfeld-Rieger et l’iridogoniodysgénésie. En général, ~75% et ~50% des personnes atteintes d’iridogoniodysgénésie et du syndrome d’Axenfeld-Rieger développent également le glaucome. Ainsi, une importante proportion des individus identifiés avec des mutations dans ce gène souffrait également de glaucome chronique. Une duplication d’une région comprenant ce gène a été identifiée chez une famille québécoise (98). Les individus de cette famille possédant cette duplication étaient principalement atteints de GPAO, certains d’entre eux souffrant d’iridogoniodysgénésie.

Avant même la diffusion publique de la séquence de l’ADNc codant pour la protéine LOC164828, les séquences de nombreux BACs positionnés dans l’intervalle d’intérêt ont été ratissées par le programme BLAST® ( Basic Local Alignment Search Tool , URL : http://www.ncbi.nlm.nih.gov/BLAST/) dans le but d’identifier des séquences similaires à la séquence codante du gène FOXC1 dans l’intervalle GLC1B . Le BAC AC012671, un clone positionné au centre de l’intervalle d’intérêt, s’est avéré contenir une séquence de type forkhead . Puisqu’aucune séquence d’ADNc de ce gène « hypothétique » n’était disponible, il était impossible, à ce moment, de déterminer la séquence codante de celui-ci. Par contre, si cette région codait effectivement pour un facteur de transcription de type FOX, la séquence identifiée par le programme BLAST devait nécessairement être associée à la séquence exonique de ce gène codant pour la boîte caractéristique des gènes de cette famille. Ainsi, les individus PR011 et PR013 (branchon initial), PR241 (extension 1839) ainsi qu’un individu cliniquement normal ont été séquencés sur la séquence génomique correspondant à la région identifiée par le programme BLAST comme étant homologue à la boîte forkhead du gène FOXC1 . Les mutations de la séquence codante du gène FOXC1 associées à des anomalies oculaires étant toutes situées dans la boîte forkhead , il avait était jugé pertinent de séquencer cette région même si elle était, à ce moment, non caractérisée.

Aucune variation n’a été observée dans la région contenant une séquence codant potentiellement pour une boîte de type forkhead chez les individus mentionnés. Une séquence d’ADNc correspondant à la protéine inconnue LOC164828 décrite au Tableau 15 a éventuellement été rendue publique le 6 février 2002 (gi:18550044) et mise à jour le 31 juillet 2002 (gi:20534576) comme étant une protéine contenant effectivement une boîte forkhead l’apparentant à FOXI1 . Contrairement au gène FOXC1 qui ne contient qu’un seul exon, il a été déterminé que la séquence codante de LOC164828 était répartie sur 5 exons couvrant une distance génomique d’environ 12 kb (Figure 53).

Selon ces données, la région séquencée chez les individus de la famille PR correspondait à la séquence codant pour les acides aminés 1 à 70 de la protéine, c'est-à-dire l’exon 1 du gène. Le domaine conservé, associé à la boîte forkhead ,comprenait toutefois une région de la protéine allant de la position 3 à 98.

Le séquençage de l’exon 2 de ce gène chez les porteurs de l’haplotype associé au locus GLC1B devrait être entrepris dans le but d’éliminer la possibilité de retrouver une mutation située dans la boîte forkhead . Le séquençage de tous les exons du gène devrait également être envisagé, tout comme la vérification de l'absence d’évènements de duplication d’une région génomique comprenant ce gène pouvant être à l’origine de la maladie, comme ceux rapportés pour FOXC1 (111). En ce sens, le marqueur polymorphique AC012671-ca (Figure 53) situé tout près du gène codant pour LOC164828 n’a révélé aucune anomalie permettant d’affirmer qu’une telle duplication existerait chez la famille PR.