SeqOne users

SeqOne étend son répertoire de variants structuraux

11 February 2021

Vos worksets GermlineVar et SomaVar intègrent un nouvel outil, permettant la détection de variants structuraux jusqu’à 300bp.

Newsletter Février 2021

Le défi des variants structuraux

Les variants structuraux (SV) sont un type important de variation génétique, dont l’impact sur  la diversité phénotypique n’est pas negligeable [1]. Générallement définis comme des insertions, délétions, duplications, inversions ou translocations de 50bp ou plus [2], ils jouent un rôle dans le développement de nombreuses maladies, y compris celui de certains cancers. 

Représentation schématique de quelques variants structuraux

Bien que moins courants que d’autres formes de variations telles que les polymorphismes mononucléotidiques (SNP), les variants structuraux sont susceptibles d’altérer de manière drastique la fonction des gènes au sein desquels ils surviennent. Ils restent cependant largement moins étudiés que ces derniers, principalement en raison de la difficulté à les détecter.

Identifier les SV à partir des données de NGS

Chaque type de SV se caractérise par un profil spécifique à l’issue de l’alignement des séquences. Un alignement qu’ils perturbent bien souvent, en particulier à l’issue de séquençage dit short reads : lorsque les SV sont d’une magnitude équivalente ou supérieure à celle d’un read de séquençage, il devient difficile sinon impossible d’aligner correctement les séquences au génome de référence. Ces profils caractéristiques sont cependant autant de signatures pouvant être exploitées pour les détecter [2].

  1. Une profondeur de couverture variable. 

Ce critère est principalement utilisé dans la détection des CNV, et peut suggérer la présence d’autres types de réarrangements telles que les fusions de gènes, sans toutefois fournir d’indication précise quant aux coordonnées génomiques exactes des points de fusion.

Retrouvez plus d’informations sur la détection des CNV en contexte constitutionnel et somatique sur SeqOne.

  1. Des paires de séquences discordantes. 

Lors de séquençage paired-end, les paires de séquences dont l’orientation ou la position sont innatendues, peuvent permettre d’inférer la présence d’un SV, tout en restant imprécis quant à ses coordonnées génomiques exacts (le point de cassure n’étant pas directement séquencé).

  1. Des split reads. 

A l’issue de l’alignement par des outils tels que BWA, certaines séquences ne sont alignées que partiellement au génome de référence. La fraction non-alignée de ces séquences est alors masquée par un processus appelé soft-clipping. Lorsque la fraction non alignée d’une séquence est suffisamment longue pour pouvoir être alignée de manière non ambigue en d’autres coordonnées génomiques, on parle de split-reads. Ces séquences chevauchant par définition le point de cassure, elles permettent de déterminer de manière précise ses coordonnées génomiques. 

Un module dédié dans vos pipelines SeqOne

Nous avons ainsi intégré aux pipelines bioinformatiques GermlineVar et SomaVar le SV caller GRIDSS, lequel tire non seulement partie des signatures mentionnées ci-dessus, mais également de toutes autres séquences présentant du soft-clipping, des indels, ainsi que les paires de reads partiellement alignées, qu’il réassemble à l’échelle du génome en amont du variant calling [3]. L’ajout de cet outil étend le répertoire des variants détectés par nos pipelines, en y incluant désormais les SV jusqu’à 300bp.

Ce module vient complémenter nos outils de détection des insertions d’éléments transposables ou encore de gènes de fusion.

Références

[1] Sudmant, P.H., Rausch, T., Gardner, E.J., Handsaker, R.E., Abyzov, A., Huddleston, J., Zhang, Y., Ye, K., Jun, G., Fritz, M.H.-Y., et al. (2015). An integrated map of structural variation in 2,504 human genomes. Nature 526, 75–81.

[2] Alkan, C., Coe, B.P., and Eichler, E.E. (2011). Genome structural variation discovery and genotyping. Nat Rev Genet 12, 363–376.

[3] Cameron, D.L., Schröder, J., Penington, J.S., Do, H., Molania, R., Dobrovic, A., Speed, T.P., and Papenfuss, A.T. (2017). GRIDSS: sensitive and specific genomic rearrangement detection using positional de Bruijn graph assembly. Genome Res 27, 2050–2060.

Need help improving your genomic analysis process ?
We'd love to help !