Les gènes sont les plans de construction de la machinerie chimique qui maintient les cellules en vie. C’est vrai pour les humains et toutes les autres formes de vie. Mais saviez-vous qu’avec 20 000 gènes, l’homme possède presque 11 000 gènes de moins que la puce d’eau ? Si le nombre de gènes ne prédit pas la complexité, qu’est-ce qui le fait ?
La réponse est que notre matériel génétique contient bien plus que les unités que nous appelons gènes. Les interrupteurs qui activent et désactivent un gène sont tout aussi importants. Et la façon dont les cellules lisent et interprètent les instructions génétiques est bien plus complexe chez les humains que chez ces puces d’eau.
Les gènes et les interrupteurs qui les contrôlent sont constitués d’ADN. Il s’agit d’une longue molécule ressemblant à une échelle en spirale. Sa forme est connue sous le nom de double hélice. Au total, trois milliards de barreaux relient les deux brins extérieurs – les supports verticaux – de cette échelle. Nous appelons les barreaux des paires de bases pour les deux produits chimiques (paire) dont ils sont constitués. Les scientifiques désignent chaque produit chimique par son initiale : A (adénine), C (cytosine), G (guanine) et T (thymine). A s’apparie toujours avec T ; C s’apparie toujours avec G.
Dans les cellules humaines, l’ADN double brin n’existe pas comme une seule molécule gigantesque. Il est divisé en plus petits morceaux appelés chromosomes (KROH-moh-soams). Ceux-ci sont regroupés en 23 paires par cellule. Cela fait 46 chromosomes au total. Ensemble, les 20 000 gènes de nos 46 chromosomes sont appelés le génome humain.
Le rôle de l’ADN est similaire à celui de l’alphabet. Il a le potentiel de transporter des informations, mais seulement si les lettres sont combinées de manière à former des mots significatifs. L’enchaînement des mots donne des instructions, comme dans une recette. Les gènes sont donc des instructions pour la cellule. Comme les instructions, les gènes ont un « début ». Leur chaîne de paires de bases doit suivre un ordre spécifique jusqu’à ce qu’ils atteignent une certaine « fin » définie.
Si les gènes sont comme une recette de base, les allèles (Ah-LEE-uhls) sont des versions de cette recette. Par exemple, les allèles du gène de la « couleur des yeux » donnent des indications pour rendre les yeux bleus, verts, bruns et ainsi de suite. Nous héritons d’un allèle, ou version du gène, de chacun de nos parents. Cela signifie que la plupart de nos cellules contiennent deux allèles, un par chromosome.
Mais nous ne sommes pas des copies exactes de nos parents (ou de nos frères et sœurs). La raison : avant que nous en héritons, les allèles sont mélangés comme un jeu de cartes. Cela se produit lorsque le corps fabrique les ovules et les spermatozoïdes. Ces cellules sont les seules à ne posséder qu’une seule version de chaque gène (au lieu de deux), regroupée dans 23 chromosomes. Les ovules et les spermatozoïdes vont fusionner au cours d’un processus appelé fécondation. C’est ainsi que commence le développement d’une nouvelle personne.
En combinant deux jeux de 23 chromosomes – un jeu provenant de l’ovule, un jeu provenant du spermatozoïde – cette nouvelle personne se retrouve avec les deux allèles habituels et 46 chromosomes. Et sa combinaison unique d’allèles ne se reproduira plus jamais exactement de la même manière. C’est ce qui rend chacun de nous unique, mais nous ne sommes pas des copies exactes de nos parents (ou de nos frères et sœurs). La raison : avant que nous n’en héritons, les allèles sont mélangés comme un jeu de cartes. Cela se produit lorsque le corps fabrique les ovules et les spermatozoïdes. Ces cellules sont les seules à ne posséder qu’une seule version de chaque gène (au lieu de deux), regroupée dans 23 chromosomes. Les ovules et les spermatozoïdes vont fusionner au cours d’un processus appelé fécondation. C’est le début du développement d’une nouvelle personne.
Une cellule fécondée doit se multiplier pour fabriquer tous les organes et parties du corps d’un bébé. Pour se multiplier, une cellule se divise en deux copies identiques. La cellule utilise les instructions sur son ADN et les produits chimiques présents dans la cellule pour produire une copie d’ADN identique pour la nouvelle cellule. Le processus se répète ensuite de nombreuses fois : une cellule se copie pour devenir deux. Et deux se copient pour devenir quatre. Et ainsi de suite.
Pour fabriquer des organes et des tissus, les cellules utilisent les instructions de leur ADN pour construire de minuscules machines. Elles contrôlent les réactions entre les produits chimiques dans la cellule qui finissent par produire des organes et des tissus. Ces petites machines sont des protéines. Lorsqu’une cellule lit les instructions d’un gène, on parle d’expression génétique. Une cellule fécondée doit se multiplier pour fabriquer tous les organes et parties du corps d’un bébé. Pour se multiplier, une cellule se divise en deux copies identiques. La cellule utilise les instructions inscrites sur son ADN et les produits chimiques qu’elle contient pour produire une copie d’ADN identique pour la nouvelle cellule. Le processus se répète ensuite de nombreuses fois : une cellule se copie pour devenir deux. Et deux se copient pour devenir quatre. Et ainsi de suite.
Comment fonctionne l’expression génétique ?
L’expression des gènes repose sur des molécules auxiliaires. Celles-ci interprètent les instructions d’un gène pour fabriquer les bons types de protéines. Un groupe important de ces auxiliaires est connu sous le nom d’ARN. Il est chimiquement similaire à l’ADN. Un type d’ARN est l’ARN messager (ARNm). C’est une copie simple brin de l’ADN double brin.
La fabrication de l’ARNm à partir de l’ADN est la première étape de l’expression génétique. Ce processus est connu sous le nom de transcription et se produit à l’intérieur du noyau de la cellule, ou noyau. La deuxième étape, appelée traduction, a lieu à l’extérieur du noyau. Elle transforme le message de l’ARNm en une protéine en assemblant les blocs de construction chimiques appropriés, appelés acides aminés (Ah-MEE-no).
Toutes les protéines humaines sont des chaînes avec différentes combinaisons de 20 acides aminés. Certaines protéines contrôlent des réactions chimiques. D’autres transportent des messages. D’autres encore fonctionnent comme des matériaux de construction. Tous les organismes ont besoin de protéines pour que leurs cellules puissent vivre et se développer.
Pour construire une protéine, les molécules d’un autre type d’ARN – l’ARN de transfert (ARNt) – s’alignent le long du brin d’ARNm. Chaque ARNt porte une séquence de trois lettres à une extrémité et un acide aminé à l’autre. Par exemple, la séquence GCG porte toujours l’acide aminé alanine (AL-uh-neen). Les ARNt font correspondre leur séquence à celle de l’ARNm, trois lettres à la fois. Ensuite, une autre molécule auxiliaire, appelée ribosome (RY-boh-soam), joint les acides aminés à l’autre extrémité pour fabriquer la protéine.
Un gène, plusieurs protéines
Les scientifiques ont d’abord pensé que chaque gène détenait le code pour fabriquer une seule protéine. Ils se sont trompés. Grâce à la machinerie ARN et à ses auxiliaires, nos cellules peuvent fabriquer bien plus de 20 000 protéines à partir de leurs 20 000 gènes. Les scientifiques ne savent pas exactement combien de plus. Ce pourrait être quelques centaines de milliers – peut-être un million!
Comment un gène peut-il fabriquer plus d’un type de protéine ? Seules certaines parties d’un gène, appelées exons, codent pour des acides aminés. Les régions situées entre les exons sont des introns. Avant que l’ARNm ne quitte le noyau d’une cellule, des molécules auxiliaires enlèvent les introns et assemblent les exons. Les scientifiques appellent cela l’épissage de l’ARNm.
Le même ARNm peut être épissé de différentes manières. Cela se produit souvent dans différents tissus (peut-être la peau, le cerveau ou le foie). C’est comme si les lecteurs « parlaient » des langues différentes et interprétaient le même message d’ADN de plusieurs façons. C’est une des façons dont le corps peut avoir plus de protéines que de gènes.
Voici une autre façon. La plupart des gènes ont plusieurs interrupteurs. Les commutateurs déterminent où un ARNm commence à lire une séquence d’ADN, et où il s’arrête. Des sites de début ou de fin différents créent des protéines différentes, certaines plus longues et d’autres plus courtes. Parfois, la transcription ne commence pas avant que plusieurs substances chimiques ne se fixent à la séquence d’ADN. Ces sites de liaison à l’ADN peuvent être éloignés du gène, mais influencent quand même le moment et la manière dont la cellule lit son message.
Les variations d’épissage et les commutateurs de gènes donnent lieu à des ARNm différents. Et ceux-ci sont traduits en différentes protéines. Les protéines peuvent également changer après que leurs blocs de construction aient été assemblés en une chaîne. Par exemple, la cellule peut ajouter des produits chimiques pour donner à une protéine une nouvelle fonction.
L’ADN détient plus que des instructions de construction
La fabrication de protéines est loin d’être le seul rôle de l’ADN. En fait, seulement un pour cent de l’ADN humain contient les exons que la cellule traduit en séquences protéiques. Les estimations de la part de l’ADN qui contrôle l’expression des gènes vont de 25 à 80 %. Les scientifiques ne connaissent pas encore le chiffre exact car il est plus difficile de trouver ces régions d’ADN régulatrices. Certaines sont des interrupteurs de gènes. D’autres fabriquent des molécules d’ARN qui ne participent pas à la construction des protéines.
Contrôler l’expression des gènes est presque aussi complexe que de diriger un grand orchestre symphonique. Il suffit de considérer ce qu’il faut pour qu’un seul ovule fécondé se transforme en un bébé en neuf mois.
Alors, est-ce important que les puces d’eau aient plus de gènes codant pour des protéines que les humains ? Pas vraiment. Une grande partie de notre complexité se cache dans les régions régulatrices de notre ADN. Et le décodage de cette partie de notre génome occupera les scientifiques pendant de très nombreuses années.