染色體重排導致的基因融合事件廣泛存在于多種腫瘤當中。例如在人類基因組研究中發現,異常的融合基因可引起惡性血液疾病以及腫瘤,包括 EMLA-ALK 和 BCR-ABL1 融合基因導致白血病,TMPRSS2-ERG(前列腺癌),EML4-ALK( 肺癌),VTI1A-TCF7L2( 直腸癌)[1]。由于基因融合產物是腫瘤中常見驅動因素,因此可作為抗癌治療中潛在的預后和治療靶標。小編之前著重介紹和比較了當下檢測融合基因的相關技術,由于新一代測序(NGS) 技術的不斷發展和廣泛應用,利用生物信息學方法來檢測融合突變也取得了較大的進展,因此本專題主要介紹 NGS 技術包括 RNA 和 DNA 兩個層面及其相關的生信方法。
新一代測序檢測融合基因主要有全基因組測序(WGS)、轉錄組測序(RNA-seq) 和目標區域靶向(根據靶向富集方法不同又分為雜交捕獲和擴增子測序)等技術。一般而言,WGS 應該在合理的測序深度下進行融合基因檢測,一般要求~30-60X,這對于腫瘤標本的低克隆性融合尤為重要。與之相反,RNA-seq 由于只能檢測轉錄和剪接成熟 mRNA 的基因組區域,因此只能檢測到相對高表達的融合。此外,根據已知的融合位點,設計特定的檢測探針,采用靶向捕獲 DNA 或 RNA panel 測序獲得遠高于 WGS 的測序深度,從而可以更敏感的檢測出融合基因,因此該技術在臨檢領域更為適用。測序讀長取決于 NGS 的平臺,在檢測融合基因時推薦較長的讀長,從而盡可能捕獲到斷裂點 [2]。
檢測技術 | 檢測層面 | 主要實驗過程 |
全基因組重測序(WGS) | DNA | 基因組 DNA 隨機片段化,加接頭,測序 |
目標區域雜交捕獲測序 | DNA/RNA | 文庫制備,加接頭,特異性 DNA/RNA 序列富集,擴增后測序 |
轉錄組測序(RNA-seq) | RNA | mRNA 反轉錄 cDNA 并制備文庫 |
目標區域擴增子測序 | RNA | 在融合點處擴增測序 |
核酸質譜 (MassArray) | RNA | 反轉錄,PCR,引物延展,基質輔助激光解吸 / 電離 |
數字化基因定量(NanoString) | RNA | 序列特異性雜交 |
融合基因檢測常用基因組方法 [2]
RNA 測序技術能夠很好地識別物種中產生異常變異的 RNA 種類,使發現因功能性或互作關系引起的基因融合及其導致的病變研究成為可能。雙端配對的 RNA 測序能夠提高基因的覆蓋率,因此對檢測基因融合具有特別的優勢,該方法已被用于病理學的研究,并為調控與治療提供潛在的可能性。目前已經有很多生物學工具基于高通量測序數據來檢測融合基因,如 FusionSeq、deFuse、TopHat-Fusion、Fusion-Hunter、STAR-Fusion 等。
RNA 測序檢測融合基因主要有兩種分析策略:
1、基于序列比對的方法,尋找不一致序列(discordant pair reads) 和覆蓋斷裂點的序列(junction/split reads) 從而識別出融合事件。
2、基于拼接比對的方法,首先組裝出新的轉錄本,然后比對到基因組,從而鑒定出與染色體重排一致的融合轉錄本 [3]。
RNA-seq 檢測融合基因的兩種分析策略 [3]
目前針對 RNA-seq 已經開發出很多檢測融合基因的生信工具,大多都是基于以上兩種分析策略進行預測的。對于融合基因檢測,RNA-seq 是一種非常高效的方法,可以在較低成本下對全基因組范圍內的融合基因進行檢測,其分辨率和通量比傳統方法要高很多,并且還能發現新的融合基因。
RNA-seq 檢測融合基因工具匯總 [3]
分析工具測評結果顯示,大多數情況下,STAR-Fusion 在所有檢測工具中的排名高,其次是 Arriba 和 STAR-SEQR,見下圖。在組裝比對策略中,TrinityFusion- C 工具排名高。值得注意的是,排名前三的工具都是采用 STAR 工具進行比對的。
RNA-seq 分析融合基因工具準確性評估 [3]
DNA 測序也可以對融合基因進行檢測,由于融合基因大多發生在內含子區域,采用 WGS 對整個基因組進行測序的方法往往成本較高,目前對于已知融合位點的檢測,推薦目標區域靶向(panel) 測序。融合基因作為結構變異(SV) 的一種類型,采用 DNA 測序分析融合基因的策略主要包括:
1、雙端序列配對法(pair-end method)
該方法總體思路是將雙端序列比對到基因組上,然后評估雙端配對序列的距離和方向是否和建庫信息一致。
2、斷裂序列法(split-read approach)
獲得比對到基因組上的單端序列,將未能比對上的那部分序列切斷,然后重新進行比對,獲得比對位置和比對方向。
目前針對 DNA 測序開發出許多檢測結構變異(SV) 的生信工具,見下圖,也有專門檢測融合基因的工具,比如 BreakID 和 GeneFuse 等工具。檢測融合基因的工具大多基于以上兩種分析策略進行預測的。不同的預測工具采用的策略有所不同,可以結合不同的檢測工具來獲得更好的靈敏度。當然,這種綜合的方法并非是結果簡單整合,而是優先考慮更準確的策略,例如斷裂序列法要優先于雙端序列配對法 [5]。
總的來說,過去的十幾年里,新一代測序技術在融合基因檢測方面發揮著越來越重要的作用,有著其他技術無法比擬的優勢。隨著測序技術的不斷發展,產生的讀長更長,也為融合基因的檢測帶來了新的機遇和挑戰。
參考文獻:
[1] Qingguo Wang, Junfeng Xia, Peilin Jia, et al. Application of next generation sequencing to human gene fusion detection: computational tools, features and perspectives. Brief Bioinform, 2013, 14(4): 506-519.
[2] Jan Schr?der , Amit Kumar , Stephen Q Wong. Overview of Fusion Detection Strategies Using Next-Generation Sequencing. Methods Mol Biol, 2019:125-138.
[3] Brian J , Alexander Dobin, Bo Li, et al. Accuracy assessment of fusion transcript detection via read-mapping and de novo fusion transcript assembly-based methods. Genome Biol, 2019, 20(1): 213.
[4] Haley J and Eric Duncavage. Detection of structural DNA variation from next generation sequencing data: a review of informatic approaches. Cancer Genet. 2013, 206(12): 432-440.
[5] Peiyong Guan, Wing-Kin Sung. Structural Variation Detection Using Next-Generation Sequencing Data: A Comparative Technical Review. Methods, 2016,102:36-49.
更多伯豪生物人工服務: