SeqOne users

Annotation des variants multinucléotidiques (MNV)

Published on 13 May 2020

SeqOne identifie les variants multi-nucléotidiques (MNV), une classe de mutations se traduisant par une succession de substitutions au sein d’un même haplotype. Jusqu’ici décomposés en multiples variants d’un seul nucleotide, ces variants seront désormais correctement annotés lors qu’ils affectent un même codon.
Cette implémentation concerne aussi bien les pipelines GermlineVar que SomaVar.

Newsletter Janvier 2020

Contexte

Les variants multi-nucléotidiques, ou MNV (pour multinucleotide variants) se définissent comme une succession de SNV (single nucleotide variant) au sein d’un même haplotype, et sont une classe de variation génétique biologiquement importante, bien que leur impact fonctionnel et leur mutagénèse soit encore largement inexplorés. 

Cela est en partie dû au fait que la plupart des pipelines d’analyses bioinformatiques utilisées pour déterminer l’impact fonctionnel des variations génétiques décomposent ces variants multiples et les annotent en tant que SNV distincts [1].

Cependant, lorsque deux variants constituant un MNV affectent le même codon, ce qui est fréquemment le cas, les interpréter indépendemment peut conduire à une prédiction erronée de leur impact au niveau de la protéine codée, et un mauvais diagnostic [2].

Exemple d’un MNV dont l’effet prédit diffère de celui des SNV qui le composent.

Nouveautés

SeqOne tire désormais partie du nombre grandissant de MNV identifiés et annotés dans les bases de données, en particulier celle de l’Exome Aggregation Consortium (ExAc). On y dénombre à ce jour plus de 5000 MNV, dont certains sont situés dans des gènes associés à des maladies [3].

Comment ça marche ?

L’étape clé dans la détection et l’annotation de ces variants est la normalisation qui survient à l’issue de l’étape de variant calling. Au cours de celle-ci, chaque variant est normalement réduit à sa représentation la plus simple dans le fichier VCF, afin d’obtenir une liste de mutations à injecter dans des bases de données externes d’annotation.

Désormais, les MNV potentiels sont identifés sur la base de leur position génomique dès l’étape de normalisation. Le choix de l’annotation pour ces variants dépend de leur effet prédit sur la protéine.

MNV codants. Lorsque plusieurs variants affectent le même codon (MNV codant), SeqOne compare les prédiction d’effet du variant multiple et de chaque variant individuel suite à l’étape d’annotation des variants. Si cet effet diffère, le MNV est reporté dans le tableau de variants, sinon le choix de la forme (simple, mutiple) conservée dépend de l’occurence du variant dans la base de données ClinVar.

MNV non-codants. C’est la version décomposée de ces variants et leurs annotations respectives qui sont proposées dans l’interface SeqOne.

L’information du potentiel MNV auquel ces variants appartiennent est tout de même conservée dans le fchier VCF annoté généré par notre pipeline, lequel peut être téléchagé depuis les résultats de l’analyse.

Bibliographie

[1] Sandmann, S., de Graaf, A.O., Karimi, M., van der Reijden, B.A., Hellström-Lindberg, E., Jansen, J.H., and Dugas, M. (2017). Evaluating Variant Calling Tools for Non-Matched Next-Generation Sequencing Data. Scientific Reports 7, 1–12.

[2] Wang, Q., Pierce-Hoffman, E., Cummings, B.B., Karczewski, K.J., Alföldi, J., Francioli, L.C., Gauthier, L.D., Hill, A.J., O’Donnell-Luria, A.H., Genome Aggregation Database (gnomAD) Production Team, G.A.D. (gnomAD) C., et al. (2019). Landscape of multi-nucleotide variants in 125,748 human exomes and 15,708 genomes. BioRxiv 573378.

[3] Lek, M., Karczewski, K.J., Minikel, E.V., Samocha, K.E., Banks, E., Fennell, T., O’Donnell-Luria, A.H., Ware, J.S., Hill, A.J., Cummings, B.B., et al. (2016). Analysis of protein-coding genetic variation in 60,706 humans. Nature 536, 285–291.

Comments

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments

Need help improving your genomic analysis process ?
We'd love to help !