Support des UMI

Les worksets SomaVar et SomaDuo sont maintenant compatibles avec les données UMI (Unique Molecular Identifier). Le mode UMI active la génération de reads consensus par index avant l’appel des variants.
SeqOne Newsletter Juin 2019
La méthode UMI (Unique Molecular Identifier) repose sur l’indexation de chaque fragment d’ADN avant l’étape de PCR. Elle permet de détecter avec précision des variants avec des fréquences alléliques (VAF) très faibles tout en en limitant le nombre de faux positifs liés aux biais de PCR [1].
À la création d’un projet vous pouvez maintenant cocher la case UMI, qui activera un pré-traitement des reads lors de l’analyse des données.
Comment ça fonctionne ?
Les données UMI sont pré-traités avec l’outil fgbio [2] afin d’extraire pour chaque read l’index UMI. Les reads sont ensuite alignés sur le génome de référence puis ré-analysés par fgbio afin d’établir pour chaque index UMI une séquence consensus. Ce consensus permet d’éliminer les mutations qui ne sont pas supportés par l’ensemble des reads séquencés avec le même index (voir illustration ci-dessous). Les reads consensus sont finalement analysés par le pipeline classique pour réaliser l’appel des variants et l’interprétation peut se faire, selon vos habitudes, sur l’interface SeqOne.

Avantages
- Une séquence consensus est déduite de tous les reads portant la même UMI pour un fragment d’ADN donné. Ceci permet de corriger les erreurs de PCR et/ou de séquençage.
- Une séquence consensus unique étant obtenu pour chaque fragment d’ADN initial, chaque molécule ne sera comptée qu’une seule fois lors de l’étape d’appel de variant. Ceci permet de réduire considérablement les biais liés à l’amplification.
Ainsi, vous pouvez interpréter sur SeqOne les variants avec une VAF faible (<5%).
Limitations actuelles
- Seule le kit UMIs de Qiagen est supporté. Si vous utilisez un autre protocole, merci de nous contacter.
- Seul le workset SomaVar est compatible avec les données UMI.
- Pour les régions avec un faible signal de capture (<2 reads par UMI), la procédure de pré-traitement des UMIs est susceptible de filtrer l’ensemble des reads. Notez que pour obtenir 90% de sensibilité sur un appel de variants avec des VAF à 5%, Qiagen recommande une profondeur de séquençage de 7200x pour 10ng d’ADN frais ou de 3640x pour 20ng d’ADN frais. Quoi qu’il en soit, nous travaillons pour ajouter un mode “rescue” pour ces régions afin de réaliser le calling, même si le traitement des UMIs a échoué.
Bibliographie
[1] Kou, R. et al. Benefits and Challenges with Applying Unique Molecular Identifiers in Next Generation Sequencing to Detect Low Frequency Mutations. PLoS One 11, e0146638 (2016).
[2] http://fulcrumgenomics.github.io/fgbio/
Comments