Myriam Guiral, the new SeqOne CCO EMEA & Biopharma Head

We are very pleased to announce the appointment of Myriam Guiral to the role of CCO EMEA & Biopharma Head. Myriam has more than 20 years of global sales and general leadership experience that will be critical to the commercial development of SeqOne Genomics. Prior to joining SeqOne, Myriam led OncoDNA’s global commercial team and before that held leadership roles at IQVIA, GE Healthcare, Abbott Diagnostics and Becton Dickinson.

‘’I am really proud to take on a leadership commercial role at this exciting time for SeqOne Genomics as it accelerates its global expansion. The company’s genomics analysis platform is well established in France and poised for international expansion. I will also spearhead the company’s new genomic analysis solution for pharmaceutical and biotech industries.‘’ said Myriam.

SeqOne étend son répertoire de variants structuraux

Vos worksets GermlineVar et SomaVar intègrent un nouvel outil, permettant la détection de variants structuraux jusqu’à 300bp.

Newsletter Février 2021

Le défi des variants structuraux

Les variants structuraux (SV) sont un type important de variation génétique, dont l’impact sur  la diversité phénotypique n’est pas negligeable [1]. Générallement définis comme des insertions, délétions, duplications, inversions ou translocations de 50bp ou plus [2], ils jouent un rôle dans le développement de nombreuses maladies, y compris celui de certains cancers. 

Représentation schématique de quelques variants structuraux

Bien que moins courants que d’autres formes de variations telles que les polymorphismes mononucléotidiques (SNP), les variants structuraux sont susceptibles d’altérer de manière drastique la fonction des gènes au sein desquels ils surviennent. Ils restent cependant largement moins étudiés que ces derniers, principalement en raison de la difficulté à les détecter.

Identifier les SV à partir des données de NGS

Chaque type de SV se caractérise par un profil spécifique à l’issue de l’alignement des séquences. Un alignement qu’ils perturbent bien souvent, en particulier à l’issue de séquençage dit short reads : lorsque les SV sont d’une magnitude équivalente ou supérieure à celle d’un read de séquençage, il devient difficile sinon impossible d’aligner correctement les séquences au génome de référence. Ces profils caractéristiques sont cependant autant de signatures pouvant être exploitées pour les détecter [2].

  1. Une profondeur de couverture variable. 

Ce critère est principalement utilisé dans la détection des CNV, et peut suggérer la présence d’autres types de réarrangements telles que les fusions de gènes, sans toutefois fournir d’indication précise quant aux coordonnées génomiques exactes des points de fusion.

Retrouvez plus d’informations sur la détection des CNV en contexte constitutionnel et somatique sur SeqOne.

  1. Des paires de séquences discordantes. 

Lors de séquençage paired-end, les paires de séquences dont l’orientation ou la position sont innatendues, peuvent permettre d’inférer la présence d’un SV, tout en restant imprécis quant à ses coordonnées génomiques exacts (le point de cassure n’étant pas directement séquencé).

  1. Des split reads. 

A l’issue de l’alignement par des outils tels que BWA, certaines séquences ne sont alignées que partiellement au génome de référence. La fraction non-alignée de ces séquences est alors masquée par un processus appelé soft-clipping. Lorsque la fraction non alignée d’une séquence est suffisamment longue pour pouvoir être alignée de manière non ambigue en d’autres coordonnées génomiques, on parle de split-reads. Ces séquences chevauchant par définition le point de cassure, elles permettent de déterminer de manière précise ses coordonnées génomiques. 

Un module dédié dans vos pipelines SeqOne

Nous avons ainsi intégré aux pipelines bioinformatiques GermlineVar et SomaVar le SV caller GRIDSS, lequel tire non seulement partie des signatures mentionnées ci-dessus, mais également de toutes autres séquences présentant du soft-clipping, des indels, ainsi que les paires de reads partiellement alignées, qu’il réassemble à l’échelle du génome en amont du variant calling [3]. L’ajout de cet outil étend le répertoire des variants détectés par nos pipelines, en y incluant désormais les SV jusqu’à 300bp.

Ce module vient complémenter nos outils de détection des insertions d’éléments transposables ou encore de gènes de fusion.

Références

[1] Sudmant, P.H., Rausch, T., Gardner, E.J., Handsaker, R.E., Abyzov, A., Huddleston, J., Zhang, Y., Ye, K., Jun, G., Fritz, M.H.-Y., et al. (2015). An integrated map of structural variation in 2,504 human genomes. Nature 526, 75–81.

[2] Alkan, C., Coe, B.P., and Eichler, E.E. (2011). Genome structural variation discovery and genotyping. Nat Rev Genet 12, 363–376.

[3] Cameron, D.L., Schröder, J., Penington, J.S., Do, H., Molania, R., Dobrovic, A., Speed, T.P., and Papenfuss, A.T. (2017). GRIDSS: sensitive and specific genomic rearrangement detection using positional de Bruijn graph assembly. Genome Res 27, 2050–2060.

Gestion plus complète des UMI en contexte somatique

Tirez-partie des UMI de manière optimale en sélectionnant l’un des 3 nouveaux modes d’analyses de SomaVar, et grâce à un rapport QC repensé et plus complet.

Newsletter Février 2021

Introduction

Etape incontournable de la plupart des protocoles NGS, tant pour la préparation des librairies que leur enrichissement en cibles d’intérêt, la PCR génère pour chaque molécule unique un nombre variable de clones, ou duplicats. 

Or cette étape est connue non seulement pour engendrer certains biais, amplifiant préférentiellement certaines séquences et augmentant ainsi artificiellement la couverture d’une position donnée dans le génome, mais également des erreurs qui peuvent s’avérer problématiques lors de la recherche de variants de très faible fréquence allélique.

Le recours à un index moléculaire unique (UMI, également connu sous le nom d’identifiant moléculaire unique) dans le workflow de prépration du séquençage, en amont de la PCR, offre une solution à ces problèmes. Ces UMI permettent à l’issue du séquençage d’identifier les séquences provenant d’une même molécule intiale, et ainsi de renforcer la précision du séquençage en éliminant les erreurs [1].

Avantages du recours aux UMI

Ceci présente deux avantages majeurs :

  • Une estimation plus précise de la fréquence allélique, en améliorant le processus de déduplication.

Au cours du pipeline d’analyse bioinformatique, les duplicats de PCR sont identifiés lors de l’étape de déduplication : les lectures s’alignant exactement à la même position dans le génome de référence étant identifiées comme autant de clones d’une seule et même molécule initiale. Une seule de ces séquences est alors retenue comme représentative de la molécule de départ pour la suite du pipeline.

Cependant deux séquences aux coordonnées génomiques identiques pourraient tout aussi bien provenir de deux séquences distinctes, issues de cellules différentes. Avec une approche de déduplication classique, celles-ci seraient réduites à une seule molécule pendant le processus de déduplication C’est donc autant de signal perdu pour la détection des variants, en plus de n’être qu’une représentation partielle du signal à cette position.

Lorsque chaque molécule est indexée en amont de l’amplification par PCR, de sorte que chacun clone puisse-t-être associé à la moculécule initiale, des séquences identiques à l’issue de l’alignement, mais provenant de molécules distinctes seront associées à des UMI différents.

  • Une sensibilité accrue pour identifier les variants de faible fréquence.

Les multiples clones de PCR peuvent être utilisés pour augmenter la qualité de la séquence représentative du fragment d’ADN d’origine. Puisque le fragment a été dupliqué avant le séquençage puis séquencé plusieurs fois, les multiples copies peuvent être utilisées pour corriger les erreurs de séquençage. En générant une séquence consensus à partir de ces duplicats, lequel repose sur un vote à la majorité pour chaque position, on peut alors éliminer en grande partie ce bruit de fond.

Cette application devient alors particulièrement utile lors de la recherche de variants de très faible fréquence allélique, lors du séquençage d’ADN tumural circulant (ADNct) par exemple, pour laquelle les erreurs générées lors de la PCR ou du séquençage peuvent rapidement devenir problématiques.

Utilisation sur SeqOne

En pratique, plusieurs modalités de traitement des UMI sont proposées sur la plateforme lors du lancement d’une analyse SomaVar :

  1. Standard mode (mode recommandé) : des consensus sont générés à partir des duplicats de PCR portant le même UMI, lorsque leur nombre est supérieur ou égal à 2. Les UMI représentés par une seule séquence (singletons) sont également conservés.
  2. High quality : les consensus sont générés à partir des duplicats de PCR portant le même UMI lorsque leur nombre est supérieur à 3, et les UMI supportées par 1 (singletons) ou 2 reads sont éliminés de l’analyse. Ce mode d’analyse est également plus stringent sur la qualité des bases à l’issue de la génération du consensus, et permet la détection de variants dont la fréquence allélique est inférieure à 1%. Il est recommandé lorsque la profondeur de séquençage est supérieure à 5000X, et pour des applications telles que le séquençage d’ADNtc.
  3. UMI disabled : les UMI ne sont pas utilisés pour la déduplication, et ceux-ci sont coupés de l’extrémité des séquences en amont de l’analyse.

Le rapport quality control de l’analyse SomaVar offre désormais une vue plus détaillée de la composition de l’échantillon, en particulier de la distribution des UMI selon le nombre de séquences qui les portent. Cette meilleure représentation de l’échantillon permet d’orienter le choix du mode d’analyse le plus approprié.

Distribution des UMI en termes de nombre de séquences au sein d’un échantillon.

Analyse des CNV

Vous souhaitez détecter les CNV à partir de vos données de capture avec UMI ? Le pipeline SomaCNVCapture sera désormais disponible dans vos projets UMI également. 


Quelle que soit la configuration sélectionnée lors du lancement de vos analyses SomaVar dans ce projet, l’analyse des CNV reposera sur une approche standard : des séquences consensus seront générées à partir des duplicats de PCR porteurs d’un même index, et les singletons seront conservés

Limitations actuelles et rétrocompatibilité

  • Seuls les kits suivants sont actuellements supportés sur la plateforme SeqOne :

– QIAGEN QIAseq 

– Agilent XTHS/Low input

– Agilent XTHS V2

– IDT xGen UDI-UMI

Si vous utilisez un autre protocole, contactez-nous !

  • Seul les worksets SomaVar et SomaRNA sont compatibles avec les données UMI.
  • Chacune des deux nouvelles configurations UMI (standard, high quality) présente des différences avec l’implémentation actuellement disponible pour SomaVar v1.4, résumées dans le tableau suivant :
SomaVar v1.4UMISomaVar v1.5 UMI standardSomaVar v1.5 UMI high quality
Nombre minimal de reads par consensus223
Qualité minimale de chaque base dans le consensus (score phred)303040
Reads hors consensus filtrésouinonoui

Bibliographie

[1] Kou, R. et al. Benefits and Challenges with Applying Unique Molecular Identifiers in Next Generation Sequencing to Detect Low Frequency Mutations. PLoS One 11, e0146638 (2016).

Using molecular clocks to tell cancer time

We all know tracking metastatic cancer progression is vital for ongoing monitoring of cancer patients, but how do metastatic cancers arise in the first place? Are they seeded simultaneously throughout the body, or do they arise progressively? How are they related to the original tumour? More importantly, how do different metastases respond to treatment, and how can we track this? Amazingly, new insights from the UK’s LEGACY breast cancer program is shedding light on some of these important questions! 

This study simultaneously examined biopsies of primary and secondary tumours from two breast cancer donors, which revealed that secondary tumours were predominantly seeded from a single cell lineage of the primary tumour. This indicates a remarkable phenomenon of monoclonal seeding for metastatic breast cancers, which also aligns with previous studies showing the same progression in colorectal cancers. 

The good news is that if cancer metastases are clonal, the ability to track their dissemination and dynamics becomes more plausible. As a first step to prove this, scientists in this study used chemical markers that progressively accumulate in DNA, serving as molecular clocks to lineage trace metastatic cancers as they spread to secondary sites. These markers can be used for metastatic cancer monitoring by charting secondary cancer ‘family trees’ for each patient. 

Next, they leveraged an easily available resource: circulating tumour DNA in blood samples from breast cancer patients. The specific molecular clock markers found in tissue samples from primary or secondary tumour biopsies were found to correlate highly with their frequency of occurrence in plasma tumour DNA. 

This is very encouraging, as it opens up a range of possibilities for following cancer progression using regular blood tests. First, metastases formation can be closely monitored, and their evolutionary lineages can be traced to the original tumour using these molecular clocks, which could point to initial treatment options. Secondly, relative pathogenic impacts of secondary tumours can also be assessed by monitoring levels of their lineage-specific molecular markers in the blood. Finally, the responses of the various metastatic tumours to different therapies can be tracked, providing the doctors with valuable real-time information that can be effectively used to optimise personalised medical treatment for each patient.

We are very excited by ongoing genomics research to develop new ways of monitoring cancer evolution, pathogenicity, and treatment outcomes using the relatively simple process of blood biopsies which will deliver better options for patients. SeqOne will continue to closely monitor progress in this rapidly growing field to enable seamless incorporation of these new techniques into our software platform for enhanced clinical outcomes.

Original article: https://www.nature.com/articles/s41467-020-15047-9

Detect fusion genes with SeqOne!

RNAseq analysis is now possible using the SeqOne Platform so that you can include the detection of expressed SNVs, Indels and fusion genes in your analysis.

We are  proud to introduce our easy-to-use and intuitive fusion gene interface that visually indicates:

  • Fusion gene details such as the identified partner,
  • Specific exon and coordinates of the breakpoint.
  • The number of reads containing the fusion gene: to increase the confidence in results. 

A link to the Cosmic database helps you to easily interpret whether the fusion is pathogenic and the interface also reports the protein’s domain, providing you with important information to assist you in choosing the best therapy for each patient.

Alignements multiples dans votre genome browser intégré

La visualisation IGV integrée sur SeqOne gagne en flexibilité, vous permettant désormais d’afficher de multiples alignements dans une même fenêtre.

Newsletter octobre 2020

Un affichage modulable dans IGV

Afin de fluidifier la navigation sur la plateforme SeqOne, et en particulier la visualisation des variants dans le genome viewer intégré, nous avons entrepris de générer un alignement allégé, centré autour des variants de chaque échantillon, à l’issue des pipelines d’analyse GermlineVar, GermlineFamily, SomaVar et SomaDuo.

Représentation schématique de la génération du bam échantillon minimal

Dans la pratique, chaque échantillon dispose désormais de deux fichiers bam associés :

  • le fichier d’alignement brut, disponible au téléchargement depuis l’onglet Files.
  • le nouveau fichier bam dit “minimal”, ou min.bam, généré à la fin de l’analyse bioinformatique et à destination d’IGV.

De plus, le genome viewer intégré gagne en flexibilité, et permet désormais l’alignement de multiples fichiers bams. Ceux-ci peuvent aussi bien être les alignements d’échantillons différents à la même position à des fins de comparaison, ou bien le même échantillon (alignement brut, ou généré par une autre analyse).

Utilisation

A partir de la page variant, une icône d’options sur l’onglet Genome browser vous permet d’accéder au menu de paramétrage des alignements (Tracks settings).

Détail des options disponibles dans le genome browser

L’ensemble des projets et échantillons de votre compte sont alors disponibles à la sélection à partir de menus déroulants.

Enfin, il est possible de sélectionner le bam souhaité parmi ceux générés pour l’échantillon, qu’il s’agisse de son alignement brut (noté sample BAM file) ou du fichier généré par le dernier pipeline lancé sur l’échantillon (noté BAM from latest analysis).

Menu de sélection de l’alignement à ajouter dans la fenêtre Genome browser