Les empreintes génétiques permettent de différencier deux individus, bien que notre ADN soit identique à 99,9%. Toutefois, les segments observés par les services médico-légaux peuvent révéler des informations sur l’état de santé des personnes dont l’ADN a été recueilli.
Afin de différencier deux empreintes génétiques, il faut donc aller chercher dans les 0,1% restants, là où l’ADN n’est pas connu pour coder quoi que ce soit de spécifique, ce qu’on appelle « l’ADN non codant. » « Parmi les quelque 3 millions de bases d’ADN (les bases forment les acides aminés, ndlr) qui ne codent pas pour les protéines, il y a des régions avec de multiples copies de courtes séquences répétées de ces bases. Ces séquences se répètent un nombre variable de fois chez différents individus. De telles régions sont appelées ‘répétitions en tandem courtes à nombre variable’ et elles constituent la base de l’analyse STR (pour « short tandem repeats »). Une collection de celles-ci peut fournir des preuves statistiques presque irréfutables de l’identité d’une personne, car la probabilité que deux personnes non apparentées aient le même nombre de séquences répétées dans ces régions devient de plus en plus faible à mesure que davantage de régions sont analysées« , explique le National Institute for Justice américain.
Une chance sur 1 milliard
Au début des années 1990, les Etats-Unis ont créé le CODIS (de l’anglais « Combined DNA Index System »), une banque de données qui répertorie les profils ADN. Les laboratoires médico-légaux contribuent à ces bases de données et fournissent des profils à partir d’échantillons collectés sur les preuves des scènes de crime, issues de personnes condamnés ou arrêtées pour un crime, mais également de personnes disparues. La justice utilise cette base de données pour essayer de faire correspondre des échantillons trouvés lors d’une enquête à des profils déjà stockés dans la base de données.
« Les 13 STR CODIS originaux ont été choisis pour être hautement polymorphes (dont il existe beaucoup de variations, ndlr), avec des différences minimales entre les populations (afin de pouvoir être utilisés avec n’importe quel individu, ndlr) ; ils peuvent être testés par PCR et se trouvent dans des domaines non-codants de l’ADN« , explique à Sciences et Avenir Rori Rholfs, professeure de biologie moléculaire à la San Francisco State University et autrice d’une récente étude publiée dans PNAS.
Avec 13 STR, la probabilité qu’une personne sans lien avec la personne réelle qui a commis le crime ait une correspondance parfaite pour les 13 était d’environ un sur un milliard. « Mais ils ont été choisis avant que le génome n’ait été séquencé en entier. Désormais, nous nous apercevons que certains de ces STR ne se situent pas du tout dans l’ADN non-codant et qu’ils sont révélateurs d’autres informations sur les individus. » En 2017, les 13 tronçons d’ADN ont été étendus à 20.
Des maladies psychiatriques, neurologiques ou dermatologiques
Avec les progrès fait en sciences depuis trente ans, le génome est désormais bien mieux connu et compris qu’à l’époque. Plusieurs travaux ont commencé à faire le lien entre d’autres STR ne faisant pas partie du CODIS et l’état de santé. L’équipe de San Francisco a voulu explorer la relation entre les STR du CODIS et l’expression des gènes. Sur les 20 marqueurs CODIS, ils ont trouvé six associations entre les marqueurs CODIS et l’expression génique de gènes voisins dans les lignées de globules blancs de plus de 400 individus qui n’avaient aucun lien les uns avec les autres dans la base de données.
sciencesetavenir