virus mutation
0 0
Read Time:3 Minute, 34 Second


Les virus mènent une existence plutôt répétitive. Ils entrent dans une cellule, détournent ses machines pour en faire un photocopieur viral, et ces copies se dirigent vers d’autres cellules armées d’instructions pour faire de même. Donc ça va, encore et encore. Mais un peu souvent, au milieu de ce copier-coller répété, les choses se mélangent. Des mutations surviennent dans les copies. Parfois, une mutation signifie qu’un acide aminé n’est pas fabriqué et qu’une protéine vitale ne se replie pas – donc dans la poubelle de l’histoire évolutive cette version virale va. Parfois, la mutation ne fait rien du tout, car différentes séquences codant pour les mêmes protéines compensent l’erreur. Mais de temps en temps, les mutations se passent parfaitement bien. Les changements n’affectent pas la capacité du virus à exister; au lieu de cela, ils produisent un changement utile, comme rendre le virus méconnaissable pour les défenses immunitaires d’une personne. Lorsque cela permet au virus d’échapper aux anticorps générés par des infections passées ou par un vaccin, on dit que cette variante mutante du virus s’est «échappée».

Les scientifiques sont toujours à l’affût des signes d’évasion potentielle. C’est vrai pour le SRAS-CoV-2, alors que de nouvelles souches émergent et que les scientifiques étudient ce que les changements génétiques pourraient signifier pour un vaccin de longue durée. (Jusqu’à présent, les choses vont bien.) C’est aussi ce qui confond les chercheurs qui étudient la grippe et le VIH, qui échappent régulièrement à nos défenses immunitaires. Donc, dans un effort pour voir ce qui pourrait arriver, les chercheurs créent des mutants hypothétiques en laboratoire et voient s’ils peuvent échapper aux anticorps prélevés sur des patients récents ou des vaccinés. Mais le code génétique offre trop de possibilités à tester chaque branche évolutive que le virus pourrait prendre avec le temps. C’est une question de suivre.

L’hiver dernier, Brian Hie, biologiste informatique au MIT et fan de la poésie lyrique de John Donne, réfléchissait à ce problème lorsqu’il s’est posé une analogie: et si nous pensions aux séquences virales comme nous pensons au langage écrit? Chaque séquence virale a une sorte de grammaire, se dit-il – un ensemble de règles qu’elle doit suivre pour être ce virus en particulier. Lorsque les mutations violent cette grammaire, le virus atteint une impasse évolutive. En termes de virologie, il manque de «fitness». De même que le langage, du point de vue du système immunitaire, on pourrait dire que la séquence a une sorte de sémantique. Il y a certaines séquences que le système immunitaire peut interpréter – et donc arrêter le virus avec des anticorps et d’autres défenses – et d’autres qu’il ne peut pas. Ainsi, une fuite virale pourrait être vue comme un changement qui préserve la grammaire de la séquence mais en change la signification.

L’analogie avait une élégance simple, presque trop simple. Mais pour Hie, c’était aussi pratique. Ces dernières années, les systèmes d’IA sont devenus très bons pour modéliser les principes de grammaire et de sémantique dans le langage humain. Pour ce faire, ils forment un système avec des ensembles de données de milliards de mots, organisés en phrases et en paragraphes, à partir desquels le système dérive des modèles. De cette façon, sans être informé de règles spécifiques, le système apprend où doivent aller les virgules et comment structurer une clause. On peut également dire qu’elle intuitivement la signification de certaines séquences – mots et phrases – en fonction des nombreux contextes dans lesquels elles apparaissent dans l’ensemble de données. Ce sont des modèles, tout en bas. C’est ainsi que les modèles de langage les plus avancés, comme GPT-3 d’OpenAI, peuvent apprendre à produire une prose parfaitement grammaticale qui parvient à rester raisonnablement sur le sujet.

Un avantage de cette idée est qu’elle est généralisable. Pour un modèle d’apprentissage automatique, une séquence est une séquence, qu’elle soit organisée en sonnets ou en acides aminés. Selon Jeremy Howard, chercheur en IA à l’Université de San Francisco et expert en modèles de langage, l’application de tels modèles à des séquences biologiques peut être fructueuse. Avec suffisamment de données provenant, par exemple, de séquences génétiques de virus connus pour être infectieux, le modèle apprendra implicitement quelque chose sur la structure des virus infectieux. «Ce modèle aura beaucoup de connaissances sophistiquées et complexes», dit-il.

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

Laisser un commentaire