Une nouvelle étude révèle que chez les champignons unicellulaires, la levure est « aléatoire ». ADN« Naturellement actif, alors que dans les cellules de mammifères, cet ADN est désactivé dans son état naturel dans les cellules de mammifères, bien qu'il ait un ancêtre commun il y a un milliard d'années et la même machinerie moléculaire de base.
La nouvelle découverte tourne autour du processus par lequel les instructions génétiques de l'ADN sont d'abord converties en une substance apparentée appelée… ARN Et puis aux protéines qui constituent les structures et les signaux du corps. Chez la levure, la souris et l'homme, la première étape de l'expression des gènes, la transcription, a lieu au cours de laquelle les « lettres » moléculaires de l'ADN (bases nucléiques) sont lues dans une seule direction. Alors que 80 % du génome humain – l’ensemble de l’ADN de nos cellules – est activement décodé en ARN, moins de 2 % de celui-ci code en réalité pour les gènes qui dirigent la construction des protéines.
Un mystère de longue date en génomique est ce qu’accomplit toute cette transcription non liée aux gènes. Est-ce juste du bruit, un effet secondaire de l’évolution, ou a-t-il des fonctions ?
Une équipe de recherche de NYU Langone Health a cherché à répondre à cette question en créant un grand gène synthétique, avec son code ADN dans l'ordre inverse de celui de son parent naturel. Ils ont ensuite inséré des gènes synthétiques dans des cellules souches de levure et de souris et surveillé les niveaux de transcription dans chacune d’elles. Publié dans la revue nature, La nouvelle étude révèle que chez la levure, le système génétique est réglé de telle sorte que presque tous les gènes sont transcrits en continu, alors que dans les cellules de mammifères, le même « état par défaut » consiste à désactiver la transcription.
Méthodologie et résultats
Fait intéressant, disent les auteurs de l’étude, l’ordre inverse du code signifiait que tous les mécanismes qui évoluaient dans les cellules de levure et de mammifères pour activer ou désactiver la transcription étaient absents parce que le code inverse était absurde. Cependant, comme une image miroir, le code inversé reflète certains des modèles de base qui apparaissent dans le code naturel en termes de fréquence de présence des lettres d’ADN, de proximité et de fréquence de répétition. Étant donné que le code inverse comporte 100 000 lettres moléculaires, l’équipe a découvert qu’il incluait de manière aléatoire de nombreuses petites portions de code jusqu’alors inconnues qui déclenchaient probablement la transcription plus fréquemment dans la levure et l’arrêtaient dans les cellules de mammifères.
« Comprendre les différences entre les versions virtuelles Classer « La génétique nous aidera à mieux comprendre quelles parties du code génétique ont des fonctions et quels sont les accidents évolutifs », a déclaré l'auteur correspondant Jeff Buckey, Ph.D., directeur de l'Institut de génétique de NYU Langone Health. « Ceci, à son tour, promet de guider l’ingénierie des levures pour fabriquer de nouveaux médicaments, créer de nouvelles thérapies géniques, ou même nous aider à trouver de nouveaux gènes enfouis dans le code massif. »
Ce travail donne du poids à la théorie selon laquelle l'état transcriptionnel très actif de la levure est si précis que l'ADN étranger est rarement injecté dans la levure, par exemple par virus Parce qu’il se copie, il est plus susceptible d’être transcrit en ARN. Si cet ARN construit une protéine ayant une fonction utile, le code sera préservé tout au long de l’évolution sous la forme d’un nouveau gène. Contrairement à l’organisme unicellulaire de la levure, qui peut se permettre de nouveaux gènes risqués qui accélèrent l’évolution, les cellules de mammifères, en tant que parties de corps contenant des millions de cellules coopérantes, sont moins libres d’incorporer un nouvel ADN chaque fois qu’elles rencontrent un virus. Plusieurs mécanismes réglementaires protègent le code soigneusement équilibré tel qu’il est.
Grand ADN
La nouvelle étude devait prendre en compte la taille des brins d'ADN, car il y a 3 milliards de « lettres » dans le génome humain, et certains gènes comptent 2 millions de lettres. Alors que les techniques populaires permettent d'apporter des modifications lettre par lettre, certaines tâches d'ingénierie sont plus efficaces si les chercheurs construisent l'ADN à partir de zéro, en apportant des modifications de grande envergure à de larges pans de code précompilé et en le remplaçant dans une cellule plutôt que dans son homologue naturel. Parce que les gènes humains sont très complexes, le laboratoire de Bucky a d'abord développé l'approche du « typage du génome » chez la levure, mais l'a récemment modifiée pour qu'elle corresponde au code génétique des mammifères. Les auteurs de l’étude utilisent des cellules de levure pour assembler de longues séquences d’ADN en une seule étape, puis les introduisent dans des cellules souches embryonnaires de souris.
Pour la présente étude, l’équipe de recherche a abordé la question de l’étendue de la propagation transcriptionnelle au cours de l’évolution en introduisant une séquence synthétique de 101 kilobases d’ADN modifié – le gène de l’hypoxanthine phosphoribosyltransférase 1 (HPRT1) humaine dans l’ordre de codage inverse. Ils ont observé une activité généralisée du gène chez la levure, malgré l’absence de code absurde pour les promoteurs, qui sont des extraits d’ADN ayant évolué pour signaler le début de la transcription.
En outre, l’équipe a identifié de petites séquences dans le code inverse, des séquences répétitives d’éléments constitutifs de l’adénosine et de la thymine, connues pour être reconnues par les facteurs de transcription, qui sont des protéines qui se lient à l’ADN pour initier la transcription. De telles séquences, qui ne comportent que 5 à 15 lettres, peuvent facilement se produire de manière aléatoire et peuvent expliquer en partie l'état par défaut hautement actif de la levure, ont indiqué les auteurs.
Au contraire, le même symbole est inversé, inséré dans le génome des cellules souches embryonnaires de souris, il n’a pas provoqué de transcription étendue. Dans ce scénario, la transcription a été réprimée même si les dinucléotides CpG avancés, connus pour arrêter (faire taire) les gènes, n'étaient pas efficaces dans le code inverse. L'équipe estime que d'autres éléments essentiels du génome des mammifères pourraient restreindre la transcription beaucoup plus que chez la levure, peut-être en recrutant directement un complexe protéique (le complexe multi-CD) connu pour l'inactivation des gènes.
« Plus nous nous rapprochons de l'introduction de la 'valeur génomique' de l'ADN absurde dans les cellules vivantes, mieux elles pourront la comparer au génome réel en évolution », a déclaré le premier auteur Brendan Camillato, étudiant diplômé du laboratoire de Buckey. « Cela pourrait nous conduire à de nouvelles frontières en matière de thérapies cellulaires artificielles, car la capacité d’insérer un ADN synthétique de plus en plus long permet de mieux comprendre ce que les génomes insérés toléreront, et potentiellement l’inclusion d’un ou plusieurs gènes plus grands et entièrement modifiés. »
Référence : « Les séquences synthétiques inversées révèlent des états génomiques putatifs » par Brendan R. Camellato, Ran Brosh et Hannah J. Ash et Matthew T. Morano et Jeff D. Bucky, 6 mars 2024, nature.
est ce que je: 10.1038/s41586-024-07128-2