SeqOne users

Analysez vos données d’RNA-seq ciblé

Published on 13 May 2020

Nouveau pipeline pour l’analyse de données RNA-Seq ciblé (capture) avec recherche des gènes de fusion, mutations et analyse du splicing.

Newsletter Janvier 2020
Logo du workset
SomaRNA™

Contexte

Gènes hybrides formés de deux gènes précédemment indépendants, les gènes de fusion résultent de réarrangements chromosomiques tels que les translocations, les délétions ou encore les inversions.

Les transcrits résultants de ces réarrangements sont impliqués dans divers types de cancers [1], étant plus susceptibles de conduire à la production de protéines anormales. Ainsi, la plupart des gènes de fusion identifiés à ce jour sont associés à des cancers hématologiques, sarcomes mais aussi carcinomes [2]. Les identifier est donc un enjeu primordial dans l’identification de cibles thérapeutiques.

Par exemple, les fusions de gènes codant pour des tyrosines kinases représentent une classe importante d’oncogènes associés aux tumeurs hématologiques et solides. Ils sont produits par des translocations et d’autres réarrangements chromosomiques d’un sous-ensemble de gènes de tyrosines kinases.  Il a été montré que les inhibiteurs de tyrosine kinase étaient particulièrement efficaces dans le traitement de ces types de cancers [3].

Nouveautés

Nous avons créé SomaRNA, un outil dédié à l’analyse de données de RNA-seq issues d’approches ciblées de type capture, permettant entre autres d’identifier et visualiser les événements de fusions de gènes à l’échelle du transcrit, tout en détectant SNV et indels.

Ce dernier est disponible au lancement d’une analyse si le type de données du projet a été défini comme ARN à sa création.

Comment ça marche ?

La détection et la visualisation des fusions par SomaRNA repose sur la combinaison de deux outils :

  • STAR, un aligneur de données RNA-seq conçu pour l’alignement de séquences non contiguës directement sur le génome de référence [4] ,
  • Arriba, qui détecte les fusions de gènes à partir d’alignements chimériques [5].

A partir des alignements chimériques issues de STAR, Arriba applique un ensemble de filtres pour éliminer les artéfacts connus et les transcrits observés en contexte non-pathologique. Il associe à chaque événement de fusion potentiel un score de confiance, lequel dépend de multiples critères :

  • le nombre de séquences supportant la fusion,
  • l’équilibre entre les split reads et les paires de reads discordantes,
  • la distance entre les breakpoints, leur position (intragénique ou non),
  • le type d’événement.

Le résultat final est une liste de prédictions de fusions, que l’interface propose sous la forme de différents onglets :

Informations générales sur la fusion, telles que le nombre de spanning reads couvrant la fusion, sa nature (translocation, duplication, inversion or délétion) et son impact sur le cadre de lecture.

Informations relatives aux partenaires, avec les symboles des gènes impliqués dans l’événement de fusion et, pour chacun, les exons impliqués à l’échelle du transcrit ainsi que les coordonnées génomiques du point de fusion.

Représentations graphiques de la fusion, aussi bien à l’échelle du gène et de l’exon, que de la protéine. 

Un premier onglet présente la structure de la fusion et les partenaires impliqués, la couverture des exons couverts par le manifeste de l’analyse étant représentée sous la forme d’un diagramme sur fond jaune :

Les domaines protéiques conservés à l’issue de la fusion  sont mis en évidence dans une seconde vue, pour permettre l’identification de cibles thérapeutiques potentielles :

Autres fonctionnalités

SomaRNA contient une étape de détection des variants à l’issue de l’alignement de STAR, via le variant caller Freebayes.

A l’instar des worksets SomaVar et GermlineVar, ces variants sont ensuite annotés et rendus disponibles dans un onglet Variants.

A venir 

Cette première itération du workset ARN sera bientôt complémentée par des modules dédiés à l’expression ainsi qu’à la détection des sites d’épissage alternatifs.

Durant la phase beta de cette fonctionnalité, n’hésitez-pas à nous faire part de vos retours par mail à l’adresse support@seqone.com.

Biblioraphie

[1] Yoshihara, K., Wang, Q., Torres-Garcia, W., Zheng, S., Vegesna, R., Kim, H., and Verhaak, R.G.W. (2015). The landscape and therapeutic relevance of cancer-associated transcript fusions. Oncogene 34, 4845–4854.

[2] Mitelman, F., Johansson, B., and Mertens, F. (2007). The impact of translocations and gene fusions on cancer causation. Nat. Rev. Cancer 7, 233–245.

[3] Medves, S., and Demoulin, J.-B. (2012). Tyrosine kinase gene fusions in cancer: translating mechanisms into targeted therapies. J. Cell. Mol. Med. 16, 237–248.

[4] Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, Batut P, Chaisson M, Gingeras TR. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013;29:15–21

[5] https://github.com/suhrig/arriba

Comments

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments

Need help improving your genomic analysis process ?
We'd love to help !