Menu
Gratuitement
Inscription
maison  /  Vitrage/ Quelles informations le code génétique code-t-il ? Code génétique universel

Quelles informations le code génétique code-t-il ? Code génétique universel

La série d’articles décrivant les origines du Code civil peut être considérée comme une enquête sur des événements dont il nous reste de nombreuses traces. Cependant, la compréhension de ces articles nécessite un certain effort pour comprendre les mécanismes moléculaires de la synthèse des protéines. Cet article constitue l'introduction d'une série d'auto-publications consacrées à l'origine du code génétique et constitue le meilleur endroit pour commencer à se familiariser avec ce sujet.
Généralement code génétique(GC) est défini comme une méthode (règle) permettant de coder une protéine sur la structure primaire de l'ADN ou de l'ARN. Dans la littérature, il est le plus souvent écrit qu'il s'agit d'une correspondance unique d'une séquence de trois nucléotides dans un gène avec un acide aminé dans une protéine synthétisée ou le point final de la synthèse protéique. Il y a cependant deux erreurs dans cette définition. Il s'agit de 20 acides aminés dits canoniques, qui font partie des protéines de tous les organismes vivants sans exception. Ces acides aminés sont des monomères protéiques. Les erreurs sont les suivantes :

1) Il n'y a pas 20 acides aminés canoniques, mais seulement 19. On peut appeler un acide aminé une substance qui contient simultanément un groupe amino -NH 2 et un groupe carboxyle - COOH. Le fait est que le monomère protéique - la proline - n'est pas un acide aminé, car il contient un groupe imino au lieu d'un groupe amino, il est donc plus correct d'appeler la proline un acide imino. Cependant, à l'avenir, dans tous les articles consacrés à l'HA, pour plus de commodité, j'écrirai environ 20 acides aminés, impliquant la nuance spécifiée. Les structures des acides aminés sont présentées sur la Fig. 1.

Riz. 1. Structures des acides aminés canoniques. Les acides aminés ont des parties constantes, indiquées en noir sur la figure, et des parties variables (ou radicaux), indiquées en rouge.

2) La correspondance des acides aminés avec les codons n'est pas toujours sans ambiguïté. Pour la violation des cas d'absence d'ambiguïté, voir ci-dessous.

L’émergence de la GC signifie l’émergence de la synthèse protéique codée. Cet événement est l’un des événements clés de la formation évolutive des premiers organismes vivants.

La structure de HA est présentée sous forme circulaire sur la figure. 2.



Riz. 2. Code génétique en forme circulaire. Le cercle intérieur est la première lettre du codon, la seconde cercle - la deuxième lettre du codon, le troisième cercle - la troisième lettre du codon, le quatrième cercle - la désignation des acides aminés dans une abréviation de trois lettres ; P - acides aminés polaires, NP - acides aminés non polaires. Pour plus de clarté sur la symétrie, l'ordre choisi des symboles est important U-C-A-G.

Commençons donc par décrire les principales propriétés de HA.

1. Tripleté. Chaque acide aminé est codé par une séquence de trois nucléotides.

2. Présence de signes de ponctuation intergéniques. Les signes de ponctuation intergéniques comprennent les séquences d'acides nucléiques auxquelles la traduction commence ou se termine.

La traduction ne peut pas commencer à partir d'un codon quelconque, mais seulement d'un codon strictement défini - départ. Le codon d'initiation comprend le triplet AUG, à partir duquel commence la traduction. Dans ce cas, ce triplet code soit pour la méthionine, soit pour un autre acide aminé - la formylméthionine (chez les procaryotes), qui ne peut être inclus qu'au début de la synthèse protéique. À la fin de chaque gène codant pour un polypeptide, il y a au moins un des 3 arrêter les codons, ou feux de freinage: UAA, UAG, UGA. Ils terminent la traduction (ce qu'on appelle la synthèse protéique sur le ribosome).

3. Compacité, ou absence de signes de ponctuation intragéniques. Au sein d'un gène, chaque nucléotide fait partie d'un codon significatif.

4. Sans chevauchement. Les codons ne se chevauchent pas ; chacun possède son propre ensemble ordonné de nucléotides, qui ne se chevauche pas avec des ensembles similaires de codons voisins.

5. Dégénérescence. La correspondance inverse dans le sens acide aminé-codon est ambiguë. Cette propriété est appelée dégénérescence. Série est un ensemble de codons qui codent pour un acide aminé, en d'autres termes, c'est un groupe codons équivalents. Pensons à un codon comme XYZ. Si XY spécifie le « sens » (c’est-à-dire un acide aminé), alors le codon est appelé fort. Si, pour déterminer la signification d'un codon, un certain Z est nécessaire, alors un tel codon est appelé faible.

La dégénérescence du code est étroitement liée à l'ambiguïté de l'appariement codon-anticodon (un anticodon désigne une séquence de trois nucléotides sur l'ARNt, qui peuvent s'apparier complémentairement avec un codon sur l'ARN messager (voir deux articles pour plus de détails à ce sujet : Mécanismes moléculaires pour assurer la dégénérescence du code Et La règle de Lagerquist. Justification physico-chimique des symétries et relations de Rumer). Un anticodon sur un ARNt peut reconnaître un à trois codons sur un ARNm.

6.Sans ambiguïté. Chaque triplet code pour un seul acide aminé ou est un terminateur de traduction.

Il existe trois exceptions connues.

D'abord. Chez les procaryotes, en première position (lettre majuscule), il code pour la formylméthionine, et dans toute autre position, pour la méthionine. Au début du gène, la formylméthionine est codée à la fois par le codon méthionine habituel AUG et également par le codon valine GUG ou leucine UUG. , qui, dans le gène, codent respectivement pour la valine et la leucine.

Dans de nombreuses protéines, la formylméthionine est clivée ou le groupe formyle est éliminé, ce qui entraîne la conversion de la formylméthionine en méthionine ordinaire.

Deuxième. En 1986, plusieurs groupes de chercheurs ont découvert que le codon d'arrêt UGA sur l'ARNm peut coder pour la sélénocystéine (voir Fig. 3), à condition qu'il soit suivi d'une séquence nucléotidique spéciale.

Riz. 3. Structure du 21ème acide aminé - sélénocystéine.

U E. coli(c'est le nom latin d'Escherichia coli) le sélénocysteyl-ARNt lors de la traduction reconnaît le codon UGA dans l'ARNm, mais seulement dans un certain contexte : pour que le codon UGA soit reconnu comme significatif, une séquence de 45 nucléotides de longueur située après l'UGA le codon est important.

L'exemple considéré montre que, si nécessaire, un organisme vivant peut modifier le sens du code génétique standard. Dans ce cas, l’information génétique contenue dans les gènes est codée de manière plus complexe. La signification d'un codon est déterminée dans le contexte d'une séquence nucléotidique étendue spécifique et avec la participation de plusieurs facteurs protéiques hautement spécifiques. Il est important que l'ARNt de la sélénocystéine ait été trouvé chez des représentants des trois branches de la vie (archées, eubactéries et eucaryotes), ce qui indique l'origine ancienne de la synthèse de la sélénocystéine et sa présence possible dans le dernier ancêtre commun universel (qui sera être discuté dans d’autres articles). Très probablement, la sélénocystéine se trouve dans tous les organismes vivants sans exception. Mais dans un organisme donné, la sélénocystéine ne se trouve que dans des dizaines de protéines. Il fait partie des centres actifs des enzymes, dans un certain nombre d'homologues dont la cystéine ordinaire peut fonctionner dans une position similaire.

Jusqu'à récemment, on pensait que le codon UGA pouvait être lu comme sélénocystéine ou comme terminal, mais il a été récemment démontré que chez les ciliés Euplotès Le codon UGA code soit pour la cystéine, soit pour la sélénocystéine. Cm. " Code génétique permet des divergences"

Troisième exception. Certains procaryotes (5 espèces d'archées et une eubactérie - les informations sur Wikipédia sont très obsolètes) contiennent un acide spécial - la pyrrolysine (Fig. 4). Il est codé par le triplet UAG, qui dans le code canonique sert de terminateur de traduction. On suppose que dans ce cas, comme dans le cas du codage de la sélénocystéine, la lecture de l'UAG en tant que codon pyrrolysine se produit en raison d'une structure spéciale sur l'ARNm. L'ARNt Pyrrolysine contient l'anticodon CTA et est aminoacylé par les ARSases de classe 2 (pour la classification des ARSases, voir l'article « Les codases aident à comprendre comment le code génétique ").

L'UAG est rarement utilisé comme codon d'arrêt et lorsqu'il est utilisé, il est souvent suivi d'un autre codon d'arrêt.

Riz. 4. Structure du 22ème acide aminé de la pyrrolysine.

7. Polyvalence. Après que le déchiffrement du Code civil ait été achevé au milieu des années 60 du siècle dernier, on a longtemps cru que le code était le même dans tous les organismes, ce qui indique l'unité d'origine de toute vie sur Terre.

Essayons de comprendre pourquoi le Code civil est universel. Le fait est que si au moins une règle de codage devait changer dans l’organisme, cela entraînerait une modification de la structure d’une partie importante des protéines. Un tel changement serait trop radical et donc presque toujours mortel, puisqu'un changement dans la signification d'un seul codon peut affecter en moyenne 1/64 de toutes les séquences d'acides aminés.

Cela nous amène à une idée très importante : le GC n’a pratiquement pas changé depuis sa formation il y a plus de 3,5 milliards d’années. Cela signifie que sa structure porte une trace de son origine, et l’analyse de cette structure peut aider à comprendre exactement comment le GC a pu apparaître.

En fait, l’HA peut différer quelque peu chez les bactéries, les mitochondries, le code nucléaire de certains ciliés et les levures. Actuellement, il existe au moins 17 codes génétiques qui diffèrent du code canonique par 1 à 5 codons. Au total, dans toutes les variantes connues d'écarts par rapport au GK universel, 18 substitutions différentes de la signification d'un codon sont utilisées. La plupart des écarts par rapport au code standard sont connus pour les mitochondries - 10. Il est à noter que les mitochondries des vertébrés, des vers plats et des échinodermes sont codées par des codes différents, et que les moisissures, les protozoaires et les coelentérés sont codés par un seul.

La proximité évolutive des espèces ne garantit pas du tout qu’elles aient des GC similaires. Les codes génétiques peuvent varier même entre différentes espèces de mycoplasmes (certaines espèces ont un code canonique, tandis que d'autres en ont des divergents). Une situation similaire est observée pour la levure.

Il est important de noter que les mitochondries descendent d’organismes symbiotiques qui se sont adaptés pour vivre à l’intérieur des cellules. Ils ont un génome considérablement réduit ; certains gènes se sont déplacés vers le noyau cellulaire. Par conséquent, les changements dans leur HA ne sont plus aussi dramatiques.

Les exceptions découvertes ultérieurement sont particulièrement intéressantes d’un point de vue évolutif, car elles peuvent aider à faire la lumière sur les mécanismes d’évolution du code.

Tableau 1.

Codes mitochondriaux dans divers organismes.

Codon

Code universel

Codes mitochondriaux

Vertébrés

Invertébrés

Levure

Plantes

U.G.A.

ARRÊT

Trp

Trp

Trp

ARRÊT

AUA

Île

Rencontré

Rencontré

Rencontré

Île

AUC

Leu

Leu

Leu

Thr

Leu

A.G.A.

Arg

ARRÊT

Ser

Arg

Arg

AGG

Arg

ARRÊT

Ser

Arg

Arg

Trois mécanismes pour changer l'acide aminé codé par le code.

La première survient lorsqu'un certain codon n'est pas utilisé (ou presque pas) par un organisme en raison de l'apparition inégale de certains nucléotides (composition GC) ou de combinaisons de nucléotides. En conséquence, un tel codon peut disparaître complètement de l'utilisation (par exemple, en raison de la perte de l'ARNt correspondant) et peut ensuite être utilisé pour coder un autre acide aminé sans causer de dommages importants à l'organisme. Ce mécanisme pourrait être responsable de l’émergence de certains dialectes codés dans les mitochondries.

La seconde est la transformation du codon stop en sens d’ovule. Dans ce cas, certaines des protéines traduites peuvent comporter des ajouts. Cependant, la situation est partiellement sauvée par le fait que de nombreux gènes se terminent souvent par non pas un, mais deux codons d'arrêt, car des erreurs de traduction sont possibles, dans lesquelles les codons d'arrêt sont lus comme des acides aminés.

La troisième est une possible lecture ambiguë de certains codons, comme c'est le cas chez certains champignons.

8 . Connectivité. Les groupes de codons équivalents (c'est-à-dire les codons codant pour le même acide aminé) sont appelés en série. GC contient 21 séries, y compris les codons stop. Dans ce qui suit, par souci de précision, tout groupe de codons sera appelé liaison, si de chaque codon de ce groupe on peut accéder à tous les autres codons du même groupe par substitutions successives de nucléotides. Sur les 21 séries, 18 sont connectées. 2 séries contiennent chacune un codon et une seule série pour l'acide aminé sérine n'est pas connectée et se divise en deux sous-séries connectées.


Riz. 5. Graphiques de connectivité pour certaines séries de codes. a - série connectée de valine ; b - série connectée de leucine ; La série sérine est incohérente et se divise en deux sous-séries connectées. Le chiffre est tiré de l'article de V.A. Ratner" Code génétique comme un système."

La propriété de connectivité peut s'expliquer par le fait que pendant la période de formation, le GC a capturé de nouveaux codons, peu différents de ceux déjà utilisés.

9. Régularité propriétés des acides aminés basées sur les racines des triplets. Tous les acides aminés codés par les triplets de la racine U sont non polaires, n'ont pas de propriétés ni de tailles extrêmes et possèdent des radicaux aliphatiques. Tous les triplés avec racine C ont des bases fortes et les acides aminés qu’ils codent sont de taille relativement petite. Tous les triplés avec la racine A ont des bases faibles et codent pour des acides aminés polaires de taille non négligeable. Les codons avec une racine G sont caractérisés par des variantes extrêmes et anormales d'acides aminés et de séries. Ils codent pour le plus petit acide aminé (glycine), le plus long et le plus plat (tryptophane), le plus long et le plus noueux (arginine), le plus réactif (cystéine) et forment une sous-série anormale pour la sérine.

10. Blocage. Le Code civil universel est un code « bloc ». Cela signifie que les acides aminés ayant des propriétés physico-chimiques similaires sont codés par des codons qui diffèrent les uns des autres par une base. La nature bloc du code est clairement visible dans la figure suivante.


Riz. 6. Structure en blocs du Code civil. Les acides aminés avec un groupe alkyle sont indiqués en blanc.


Riz. 7. Représentation en couleur des propriétés physicochimiques des acides aminés, basée sur les valeurs décrites dans le livreStyers "Biochimie". À gauche se trouve l’hydrophobie. À droite, la capacité à former une hélice alpha dans une protéine. Les couleurs rouge, jaune et bleue indiquent les acides aminés présentant une hydrophobie élevée, moyenne et faible (à gauche) ou le degré correspondant de capacité à former une hélice alpha (à droite).

La propriété de bloc et de régularité peut également s'expliquer par le fait que pendant la période de formation, le GC a capturé de nouveaux codons, peu différents de ceux déjà utilisés.

Les codons avec les mêmes premières bases (préfixes de codons) codent pour des acides aminés avec des voies de biosynthèse similaires. Les codons des acides aminés appartenant aux familles shikimate, pyruvate, aspartate et glutamate ont respectivement U, G, A et C comme préfixes. Sur les chemins de la biosynthèse ancienne des acides aminés et son lien avec les propriétés du code moderne, voir « Doublet antique code génétique a été prédéterminé par les voies de synthèse des acides aminés." Sur la base de ces données, certains chercheurs concluent que la formation du code a été fortement influencée par les relations biosynthétiques entre les acides aminés. Cependant, la similitude des voies de biosynthèse ne signifie pas du tout la similitude de propriétés physico-chimiques.

11. Immunité au bruit. Dans sa forme la plus générale, l'immunité au bruit de l'HA signifie qu'en cas de mutations ponctuelles aléatoires et d'erreurs de traduction, les propriétés physicochimiques des acides aminés ne changent pas beaucoup.

Dans la plupart des cas, le remplacement d'un nucléotide dans un triplet n'entraîne pas de modification de l'acide aminé codé ou entraîne une modification en un acide aminé ayant la même polarité.

L'un des mécanismes qui assurent l'immunité au bruit d'un GC est sa dégénérescence. La dégénérescence moyenne est égale au nombre de signaux codés/nombre total de codons, les signaux codés comprenant 20 acides aminés et le signe de terminaison de la traduction. La dégénérescence moyenne pour tous les acides aminés et le signe de terminaison est de trois codons par signal codé.

Afin de quantifier l'immunité au bruit, nous introduisons deux concepts. Les mutations par substitution nucléotidique qui n'entraînent pas de changement dans la classe de l'acide aminé codé sont appelées conservateur. Les mutations de substitutions nucléotidiques conduisant à un changement dans la classe de l'acide aminé codé sont appelées radical .

Chaque triplet permet 9 substitutions simples. Il existe au total 61 triplets codant pour les acides aminés. Par conséquent, le nombre de substitutions nucléotidiques possibles pour tous les codons est de

61 x 9 = 549. Parmi ceux-ci :

23 substitutions de nucléotides aboutissent à des codons d'arrêt.

134 substitutions ne modifient pas l’acide aminé codé.
230 substitutions ne changent pas la classe de l'acide aminé codé.
162 substitutions entraînent un changement de classe d'acides aminés, c'est-à-dire sont radicaux.
Sur les 183 substitutions du 3ème nucléotide, 7 conduisent à l'apparition de terminateurs de traduction, et 176 sont conservatrices.
Sur les 183 substitutions du 1er nucléotide, 9 conduisent à l'apparition de terminateurs, 114 sont conservatrices et 60 radicales.
Sur les 183 substitutions du 2ème nucléotide, 7 conduisent à l'apparition de terminateurs, 74 sont conservatrices, 102 sont radicales.

Sur la base de ces calculs, nous obtenons une évaluation quantitative de l'immunité au bruit du code comme le rapport du nombre de remplacements conservateurs au nombre de remplacements radicaux. Il est égal à 364/162=2,25

Lors d’une évaluation réaliste de la contribution de la dégénérescence à l’immunité au bruit, il est nécessaire de prendre en compte la fréquence d’apparition des acides aminés dans les protéines, qui varie selon les espèces.

Quelle est la raison de l’immunité au bruit du code ? La plupart des chercheurs pensent que cette propriété est une conséquence de la sélection de GC alternatifs.

Stephen Freeland et Lawrence Hurst ont généré de tels codes aléatoires et ont découvert que seul un code alternatif sur cent n'était pas moins résistant au bruit que le code universel.
Un fait encore plus intéressant est apparu lorsque ces chercheurs ont introduit une contrainte supplémentaire pour tenir compte des tendances réelles des modèles de mutation de l’ADN et des erreurs de traduction. Dans de telles conditions, UN SEUL CODE SUR UN MILLION POSSIBLE s’est avéré meilleur que le code canonique.
Cette vitalité sans précédent du code génétique s’explique très facilement par le fait qu’il s’est formé à la suite de la sélection naturelle. Peut-être existait-il autrefois de nombreux codes dans le monde biologique, chacun ayant sa propre sensibilité aux erreurs. L'organisme qui y faisait face le mieux avait de plus grandes chances de survie, et le code canonique gagnait tout simplement la lutte pour l'existence. Cette hypothèse semble tout à fait réaliste : après tout, nous savons que des codes alternatifs existent réellement. Pour plus d'informations sur l'immunité au bruit, voir Coded évolution (S. Freeland, L. Hirst « Coded évolution ». // Dans le monde de la science. - 2004, n° 7).

En conclusion, je propose de compter le nombre de codes génétiques possibles pouvant être générés pour les 20 acides aminés canoniques. Pour une raison quelconque, je n’ai trouvé ce numéro nulle part. Nous avons donc besoin que les GC générés contiennent 20 acides aminés et un signal d'arrêt, codé par AU MOINS UN CODON.

Numérotons mentalement les codons dans un certain ordre. Nous raisonnerons ainsi. Si nous avons exactement 21 codons, alors chaque acide aminé et signal d’arrêt occupera exactement un codon. Dans ce cas, il y aura 21 GC possibles !

S'il y a 22 codons, alors un codon supplémentaire apparaît, qui peut avoir l'un des 21 sens, et ce codon peut être situé à n'importe lequel des 22 endroits, tandis que les codons restants ont exactement un sens différent, comme dans le cas de 21. codons. Nous obtenons ensuite le nombre de combinaisons 21!x(21x22).

S'il y a 23 codons, alors, en raisonnant de la même manière, nous obtenons que 21 codons ont exactement une signification différente chacun (21 ! options), et deux codons ont 21 significations différentes chacun (21 2 significations avec une position FIXE de ces codons). Le nombre de positions différentes pour ces deux codons sera de 23x22. Le nombre total de variantes GC pour 23 codons est de 21!x21 2 x23x22

S'il y a 24 codons, alors le nombre de GC sera de 21!x21 3 x24x23x22,...

....................................................................................................................

S'il y a 64 codons, alors le nombre de GC possibles sera de 21!x21 43 x64!/21! = 21 43 x64 ! ~ 9,1x10 145

Conférence 5. Code génétique

Définition du concept

Le code génétique est un système permettant d'enregistrer des informations sur la séquence d'acides aminés dans les protéines en utilisant la séquence de nucléotides dans l'ADN.

L’ADN n’étant pas directement impliqué dans la synthèse des protéines, le code est écrit en langage ARN. L'ARN contient de l'uracile au lieu de la thymine.

Propriétés du code génétique

1. Tripleté

Chaque acide aminé est codé par une séquence de 3 nucléotides.

Définition : un triplet ou codon est une séquence de trois nucléotides codant pour un acide aminé.

Le code ne peut pas être monoplet, puisque 4 (le nombre de nucléotides différents dans l'ADN) est inférieur à 20. Le code ne peut pas être doublet, car 16 (le nombre de combinaisons et de permutations de 4 nucléotides de 2) est inférieur à 20. Le code peut être triplet, car 64 (le nombre de combinaisons et de permutations de 4 à 3) est supérieur à 20.

2. Dégénérescence.

Tous les acides aminés, à l'exception de la méthionine et du tryptophane, sont codés par plus d'un triplet :

2 AK pour 1 triplet = 2.

9 AK, 2 triplés chacun = 18.

1 AK 3 triplés = 3.

5 AK de 4 triplés = 20.

3 AK de 6 triplés = 18.

Au total, 61 triplets codent pour 20 acides aminés.

3. Présence de signes de ponctuation intergéniques.

Définition:

Gène - une section d'ADN qui code pour une chaîne polypeptidique ou une molécule ARNt, rARN ouARNs.

GènesARNt, ARNr, ARNsles protéines ne sont pas codées.

À la fin de chaque gène codant pour un polypeptide, il y a au moins un des trois triplets codant pour les codons d'arrêt de l'ARN, ou signaux d'arrêt. Dans l'ARNm, ils ont la forme suivante : UAA, UAG, UGA . Ils terminent (terminent) la diffusion.

Classiquement, le codon appartient également aux signes de ponctuation AOÛT - le premier après la séquence leader. (Voir leçon 8) Il fonctionne comme une lettre majuscule. Dans cette position, il code pour la formylméthionine (chez les procaryotes).

4. Sans ambiguïté.

Chaque triplet code pour un seul acide aminé ou est un terminateur de traduction.

L'exception est le codon AOÛT . Chez les procaryotes, en première position (lettre majuscule), il code pour la formylméthionine, et dans toute autre position, il code pour la méthionine.

5. Compacité ou absence de signes de ponctuation intragéniques.
Au sein d'un gène, chaque nucléotide fait partie d'un codon significatif.

En 1961, Seymour Benzer et Francis Crick prouvèrent expérimentalement la nature triple du code et sa compacité.

L'essence de l'expérience : mutation « + » - insertion d'un nucléotide. Mutation "-" - perte d'un nucléotide. Une seule mutation « + » ou « - » au début d'un gène gâche le gène entier. Une double mutation "+" ou "-" gâte également l'ensemble du gène.

Une triple mutation « + » ou « - » au début d’un gène n’en gâte qu’une partie. Une quadruple mutation « + » ou « - » gâte à nouveau le gène entier.

L'expérience prouve que Le code est transcrit et il n’y a aucun signe de ponctuation à l’intérieur du gène. L'expérience a été réalisée sur deux gènes de phages adjacents et a montré en outre : présence de signes de ponctuation entre les gènes.

6. Polyvalence.

Le code génétique est le même pour toutes les créatures vivant sur Terre.

En 1979, Burrell a ouvert idéal code des mitochondries humaines.

Définition:

« Idéal » est un code génétique dans lequel la règle de dégénérescence du code quasi-doublet est satisfaite : si dans deux triplets les deux premiers nucléotides coïncident et que les troisièmes nucléotides appartiennent à la même classe (les deux sont des purines ou les deux sont des pyrimidines) , alors ces triplets codent pour le même acide aminé .

Il existe deux exceptions à cette règle dans le code universel. Les deux écarts par rapport au code idéal dans l’universel portent sur des points fondamentaux : le début et la fin de la synthèse protéique :

Codon

Universel

code

Codes mitochondriaux

Vertébrés

Invertébrés

Levure

Plantes

ARRÊT

ARRÊT

Avec l'UA

AGA

ARRÊT

ARRÊT

230 substitutions ne changent pas la classe de l'acide aminé codé. à la déchirure.

En 1956, Georgiy Gamow a proposé une variante du code superposé. Selon le code Gamow, chaque nucléotide, à partir du troisième du gène, fait partie de 3 codons. Lorsque le code génétique a été déchiffré, il s’est avéré qu’il ne se chevauchait pas, c’est-à-dire Chaque nucléotide fait partie d'un seul codon.

Avantages d'un code génétique superposé : compacité, moindre dépendance de la structure protéique à l'insertion ou à la délétion d'un nucléotide.

Inconvénient : la structure de la protéine dépend fortement du remplacement des nucléotides et des restrictions imposées aux voisins.

En 1976, l'ADN du phage φX174 a été séquencé. Il possède un ADN circulaire simple brin composé de 5375 nucléotides. On savait que le phage codait pour 9 protéines. Pour 6 d’entre eux, des gènes localisés les uns après les autres ont été identifiés.

Il s’est avéré qu’il y avait un chevauchement. Le gène E est entièrement situé dans le gène D . Son codon d'initiation résulte d'un décalage de trame d'un nucléotide. Gène J. commence là où le gène se termine D . Codon initial d'un gène J. chevauche le codon stop du gène D à la suite d'un déplacement de deux nucléotides. La construction est appelée « décalage du cadre de lecture » ​​par un nombre de nucléotides non multiple de trois. À ce jour, le chevauchement n’a été mis en évidence que pour quelques phages.

Capacité informationnelle de l’ADN

Il y a 6 milliards de personnes vivant sur Terre. Informations héréditaires à leur sujet
enfermé dans 6x10 9 spermatozoïdes. Selon diverses estimations, une personne possède entre 30 et 50
mille gènes. Tous les humains possèdent environ 30 x 10 13 gènes, soit 30 x 10 16 paires de bases, qui constituent 10 17 codons. La page moyenne d'un livre contient 25x10 2 caractères. L'ADN de 6x10 9 spermatozoïdes contient des informations égales en volume à environ

4x10 13 pages de livre. Ces pages occuperaient l'espace de 6 bâtiments de la NSU. 6x10 9 spermatozoïdes occupent un demi-dé à coudre. Leur ADN occupe moins d’un quart de dé à coudre.

Nucléotides ADN et ARN
  1. Purines : adénine, guanine
  2. Pyrimidine : cytosine, thymine (uracile)

Codon- un triplet de nucléotides codant pour un acide aminé spécifique.

languette. 1. Acides aminés que l’on trouve couramment dans les protéines
Nom Abréviation
1. AlanineHélas
2. ArginineArg
3. AsparaginesAsn
4. Acide aspartiqueAspic
5. CystéineCys
6. Acide glutamiqueGlu
7. GlutamineGln
8. GlycineGly
9. HistidineSon
10. IsoleucineÎle
11. LeucineLeu
12. LysineLys
13. MéthionineRencontré
14. PhénylalaninePhé
15. ProlinePro
16. SérieSer
17. ThréonineThr
18. TryptophaneTrp
19. TyrosineTyr
20. ValinVal

Le code génétique, également appelé code des acides aminés, est un système permettant d'enregistrer des informations sur la séquence d'acides aminés d'une protéine en utilisant la séquence de résidus nucléotidiques de l'ADN contenant l'une des 4 bases azotées : adénine (A), guanine (G). ), la cytosine (C) et la thymine (T). Cependant, comme l'hélice d'ADN double brin n'est pas directement impliquée dans la synthèse de la protéine codée par l'un de ces brins (c'est-à-dire l'ARN), le code est écrit en langage ARN, qui contient à la place de l'uracile (U). de thymine. Pour la même raison, il est d'usage de dire qu'un code est une séquence de nucléotides, et non des paires de nucléotides.

Le code génétique est représenté par certains mots de code, appelés codons.

Le premier mot de code a été déchiffré par Nirenberg et Mattei en 1961. Ils ont obtenu un extrait d'E. coli contenant des ribosomes et d'autres facteurs nécessaires à la synthèse des protéines. Le résultat était un système acellulaire pour la synthèse des protéines, capable d'assembler des protéines à partir d'acides aminés si l'ARNm nécessaire était ajouté au milieu. En ajoutant au milieu un ARN synthétique constitué uniquement d’uraciles, ils ont découvert qu’il se formait une protéine constituée uniquement de phénylalanine (polyphénylalanine). Ainsi, il a été établi que le triplet de nucléotides UUU (codon) correspond à la phénylalanine. Au cours des 5 à 6 années suivantes, tous les codons du code génétique ont été déterminés.

Le code génétique est une sorte de dictionnaire qui traduit un texte écrit avec quatre nucléotides en un texte protéique écrit avec 20 acides aminés. Les acides aminés restants présents dans les protéines sont des modifications de l’un des 20 acides aminés.

Propriétés du code génétique

Le code génétique a les propriétés suivantes.

  1. Tripleté- Chaque acide aminé correspond à un triplet de nucléotides. Il est facile de calculer qu’il y a 4 3 = 64 codons. Parmi ceux-ci, 61 sont sémantiques et 3 sont absurdes (terminaison, codons d'arrêt).
  2. Continuité(pas de marques de séparation entre les nucléotides) - absence de signes de ponctuation intragéniques ;

    Au sein d'un gène, chaque nucléotide fait partie d'un codon significatif. En 1961 Seymour Benzer et Francis Crick ont ​​prouvé expérimentalement la nature triplet du code et sa continuité (compacité) [montrer]

    L'essence de l'expérience : mutation « + » - insertion d'un nucléotide. Mutation "-" - perte d'un nucléotide.

    Une simple mutation ("+" ou "-") au début d'un gène ou une double mutation ("+" ou "-") gâche le gène entier.

    Une triple mutation ("+" ou "-") au début d'un gène n'altère qu'une partie du gène.

    Une quadruple mutation « + » ou « - » gâte à nouveau le gène entier.

    L'expérience a été réalisée sur deux gènes de phages adjacents et a montré que

    1. le code est un triplet et il n'y a pas de ponctuation à l'intérieur du gène
    2. il y a des signes de ponctuation entre les gènes
  3. Présence de signes de ponctuation intergéniques- la présence parmi les triplets de codons initiateurs (ils débutent la biosynthèse des protéines) et de codons terminateurs (indiquant la fin de la biosynthèse des protéines) ;

    Classiquement, le codon AUG, le premier après la séquence leader, appartient également aux signes de ponctuation. Cela fonctionne comme une lettre majuscule. Dans cette position, il code pour la formylméthionine (chez les procaryotes).

    À la fin de chaque gène codant pour un polypeptide se trouve au moins un des 3 codons stop, ou signaux stop : UAA, UAG, UGA. Ils mettent fin à la diffusion.

  4. Colinéarité- correspondance de la séquence linéaire des codons de l'ARNm et des acides aminés dans la protéine.
  5. Spécificité- chaque acide aminé correspond uniquement à certains codons qui ne peuvent être utilisés pour un autre acide aminé.
  6. Unidirectionnalité- les codons sont lus dans une direction - du premier nucléotide aux suivants
  7. Dégénérescence ou redondance, - un acide aminé peut être codé par plusieurs triplets (acides aminés - 20, triplets possibles - 64, 61 d'entre eux sont sémantiques, c'est-à-dire qu'en moyenne, chaque acide aminé correspond à environ 3 codons) ; les exceptions sont la méthionine (Met) et le tryptophane (Trp).

    La raison de la dégénérescence du code est que la charge sémantique principale est portée par les deux premiers nucléotides du triplet, et que le troisième n'est pas si important. D'ici règle de dégénérescence du code : Si deux codons ont les deux premiers nucléotides identiques et que leurs troisièmes nucléotides appartiennent à la même classe (purine ou pyrimidine), alors ils codent pour le même acide aminé.

    Il existe cependant deux exceptions à cette règle idéale. Il s'agit du codon AUA, qui doit correspondre non pas à l'isoleucine, mais à la méthionine, et du codon UGA, qui est un codon stop, alors qu'il doit correspondre au tryptophane. La dégénérescence du code a évidemment une signification adaptative.

  8. Polyvalence- toutes les propriétés ci-dessus du code génétique sont caractéristiques de tous les organismes vivants.
    Codon Code universel Codes mitochondriaux
    Vertébrés Invertébrés Levure Plantes
    U.G.A.ARRÊTTrpTrpTrpARRÊT
    AUAÎleRencontréRencontréRencontréÎle
    AUCLeuLeuLeuThrLeu
    A.G.A.ArgARRÊTSerArgArg
    AGGArgARRÊTSerArgArg

    Récemment, le principe de l'universalité du code a été ébranlé à l'occasion de la découverte par Berrell en 1979 du code idéal des mitochondries humaines, dans lequel la règle de la dégénérescence du code est satisfaite. Dans le code mitochondrial, le codon UGA correspond au tryptophane, et l'AUA à la méthionine, comme l'exige la règle de dégénérescence du code.

    Peut-être qu'au début de l'évolution, tous les organismes simples avaient le même code que les mitochondries, puis il a subi de légères déviations.

  9. Sans chevauchement- chacun des triplets du texte génétique est indépendant les uns des autres, un nucléotide n'est inclus que dans un seul triplet ; En figue. montre la différence entre le code qui se chevauche et celui qui ne se chevauche pas.

    En 1976 L'ADN du phage φX174 a été séquencé. Il possède un ADN circulaire simple brin composé de 5375 nucléotides. On savait que le phage codait pour 9 protéines. Pour 6 d’entre eux, des gènes localisés les uns après les autres ont été identifiés.

    Il s’est avéré qu’il y avait un chevauchement. Le gène E est entièrement situé dans le gène D. Son codon d'initiation apparaît à la suite d'un décalage de trame d'un nucléotide. Le gène J commence là où se termine le gène D. Le codon d'initiation du gène J chevauche le codon d'arrêt du gène D à la suite d'un déplacement de deux nucléotides. La construction est appelée « décalage du cadre de lecture » ​​par un nombre de nucléotides non multiple de trois. À ce jour, le chevauchement n’a été mis en évidence que pour quelques phages.

  10. Immunité au bruit- le rapport du nombre de substitutions conservatrices au nombre de substitutions radicales.

    Les mutations par substitution nucléotidique qui n'entraînent pas de changement dans la classe de l'acide aminé codé sont dites conservatrices. Les mutations par substitution nucléotidique qui conduisent à un changement dans la classe de l'acide aminé codé sont appelées radicaux.

    Étant donné que le même acide aminé peut être codé par différents triplets, certaines substitutions dans les triplets n'entraînent pas de modification de l'acide aminé codé (par exemple, UUU -> UUC laisse la phénylalanine). Certaines substitutions changent un acide aminé en un autre de la même classe (non polaire, polaire, basique, acide), d'autres substitutions changent également la classe de l'acide aminé.

    Dans chaque triplet, 9 substitutions simples peuvent être effectuées, c'est-à-dire Il existe trois façons de choisir la position à modifier (1ère, 2ème ou 3ème), et la lettre sélectionnée (nucléotide) peut être remplacée par 4-1=3 autres lettres (nucléotide). Le nombre total de substitutions nucléotidiques possibles est de 61 sur 9 = 549.

    Par calcul direct à l'aide de la table des codes génétiques, vous pouvez vérifier que parmi ceux-ci : 23 substitutions de nucléotides conduisent à l'apparition de codons - terminateurs de traduction. 134 substitutions ne modifient pas l’acide aminé codé. 230 substitutions ne changent pas la classe de l'acide aminé codé. 162 substitutions entraînent un changement de classe d'acides aminés, c'est-à-dire sont radicaux. Sur les 183 substitutions du 3ème nucléotide, 7 conduisent à l'apparition de terminateurs de traduction, et 176 sont conservatrices. Sur les 183 substitutions du 1er nucléotide, 9 conduisent à l'apparition de terminateurs, 114 sont conservatrices et 60 radicales. Sur les 183 substitutions du 2ème nucléotide, 7 conduisent à l'apparition de terminateurs, 74 sont conservatrices, 102 sont radicales.


Le code génétique est généralement compris comme un système de signes indiquant la disposition séquentielle des composés nucléotidiques dans l'ADN et l'ARN, ce qui correspond à un autre système de signes affichant la séquence des composés d'acides aminés dans une molécule protéique.

C'est important!

Lorsque les scientifiques ont réussi à étudier les propriétés du code génétique, l'universalité a été reconnue comme l'une des principales. Oui, aussi étrange que cela puisse paraître, tout est uni par un code génétique unique, universel et commun. Il s’est formé sur une longue période et le processus s’est terminé il y a environ 3,5 milliards d’années. Par conséquent, des traces de son évolution peuvent être retracées dans la structure du code, depuis sa création jusqu'à nos jours.

Lorsque nous parlons de la séquence de disposition des éléments dans le code génétique, nous voulons dire qu'elle est loin d'être chaotique, mais qu'elle a un ordre strictement défini. Et cela détermine aussi en grande partie les propriétés du code génétique. Cela équivaut à la disposition des lettres et des syllabes dans les mots. Une fois que nous rompons l’ordre habituel, la plupart de ce que nous lisons sur les pages des livres ou des journaux se transformera en charabia ridicule.

Propriétés de base du code génétique

Habituellement, le code contient des informations cryptées de manière spéciale. Afin de déchiffrer le code, vous devez connaître les caractéristiques distinctives.

Ainsi, les principales propriétés du code génétique sont :

  • triplicité;
  • dégénérescence ou redondance ;
  • sans ambiguïté;
  • continuité;
  • la polyvalence déjà mentionnée ci-dessus.

Examinons de plus près chaque propriété.

1. Tripleté

C'est lorsque trois composés nucléotidiques forment une chaîne séquentielle au sein d'une molécule (c'est-à-dire l'ADN ou l'ARN). En conséquence, un composé triplet est créé ou code pour l'un des acides aminés, son emplacement dans la chaîne peptidique.

Les codons (ce sont aussi des mots de code !) se distinguent par leur séquence de connexions et par le type de composés azotés (nucléotides) qui en font partie.

En génétique, il est d'usage de distinguer 64 types de codons. Ils peuvent former des combinaisons de quatre types de nucléotides, 3 chacun. Cela équivaut à élever le nombre 4 à la puissance trois. Ainsi, la formation de 64 combinaisons de nucléotides est possible.

2. Redondance du code génétique

Cette propriété est observée lorsque plusieurs codons sont nécessaires pour chiffrer un acide aminé, généralement entre 2 et 6. Et seul le tryptophane peut être codé à l’aide d’un triplet.

3. Sans ambiguïté

Il fait partie des propriétés du code génétique en tant qu'indicateur d'un héritage génétique sain. Par exemple, le triplet GAA, qui occupe la sixième place de la chaîne, peut renseigner les médecins sur le bon état du sang, sur une hémoglobine normale. C'est lui qui transporte les informations sur l'hémoglobine, et elles sont également codées par celle-ci. Et si une personne souffre d'anémie, l'un des nucléotides est remplacé par une autre lettre du code - U, qui est un signal de la maladie.

4. Continuité

Lors de l'enregistrement de cette propriété du code génétique, il ne faut pas oublier que les codons, comme les maillons d'une chaîne, ne sont pas situés à distance, mais à proximité directe, les uns après les autres dans la chaîne d'acide nucléique, et que cette chaîne n'est pas interrompue - il n'y a ni début ni fin.

5. Polyvalence

Nous ne devons jamais oublier que tout sur Terre est uni par un code génétique commun. Ainsi, chez les primates et les humains, chez les insectes et les oiseaux, dans un baobab centenaire et un brin d’herbe à peine sorti de terre, des triplets similaires sont codés par des acides aminés similaires.

C'est dans les gènes que sont contenues les informations de base sur les propriétés d'un organisme particulier, une sorte de programme que l'organisme hérite de ceux qui ont vécu plus tôt et qui existe sous forme de code génétique.