盡管轉錄組研究已經獲得很多令人激動的進展,但它終歸還是一個高度協調的、受表觀基因組調控的基因表達程序的副產物。表觀基因組是由 DNA 的染色質狀態決定的,這種狀態可以是開放的(可及的),也可以是封閉的(不可及的)。染色質狀態影響了 DNA 結合蛋白(如轉錄因子或 RNA 聚合酶)如何與基因組 DNA 相互作用,這意味著表觀基因組調控不僅可以影響發育方向、疾病進展和治療反應,還往往發生在轉錄變化之前,并可用來揭示其他方法難以區分的細胞類型。
研究人員已經利用單細胞 ATAC(轉座酶可及性染色質分析)來鑒定樣本中的調控元件。如今為了更深入的了解細胞身份,許多研究人員正在嘗試獲取一種綜合細胞開放染色質圖譜和基因表達譜的統一視圖。有些研究人員將樣本一分為二,用單細胞 RNA-seq 處理一半樣本,用單細胞 ATAC-seq 處理另一半樣本,從而同時獲得轉錄組和表觀基因組信息。然后,他們據此推斷哪些類型的細胞在兩個數據集中相互對應。然而,這種方法在很大程度上依賴于轉錄起始位點、啟動子位置和基因表達水平之間關系的假設,以及有關不同類型細胞的表觀遺傳學特征的先驗信息。此外,處理兩份樣本的不同流程之間的差異也可能會影響細胞狀態和結果。設想一下另一種選擇,您可以在同一時間分析同一個細胞中的這兩種模式。不需要推斷,不需要等待生物信息學家來對配對結果進行分析,即使在細胞數量很少時,也不需要反復糾結應該優先采用哪種檢測。
全新的 Chromium 單細胞多組學 ATAC + 基因表達,就能夠實現這一點。該產品可同時捕獲同一單細胞的轉錄組和表觀基因組,為您提供所需的、足夠深入的信息去鑒定基因表達模式、細胞類型,以及細胞狀態是如何建立的。您能夠對樣本進行更加深入、高置信度地分析,從而借助關鍵的基因表達標志物,您可以發現新的基因調控相互作用,或更好地解釋表觀遺傳特征。
讓我們想象一種場景,假設一名癌癥研究人員想了解治療耐藥性背后的機制。分別對有應答和無應答患者樣本的相同細胞進行 mRNA 表達和染色質景觀圖譜分析,他們能夠鑒定腫瘤特異性的轉錄因子和關鍵調控元件的激活,然后通過相關的基因表達變化將它們與下游目標基因關聯起來。這些信息將有助于闡明引起耐藥性的癌細胞特異性的基因調控程序和基因表達特征。當然,這僅僅是一個使用案例。讓我們再深入思考一下:單細胞多組學 ATAC + 基因表達如何揭示驅動免疫細胞譜系分化的基因調控網絡,又如何鑒定與神經退行性疾病和精神疾病相關的目標基因和細胞類型?它可以為您帶來哪些更深入的見解?
那么,該實驗是如何運行的?
為了了解這種雙重處理如何進行,我們采訪了兩名參與開發單細胞多組學 ATAC + 基因表達的 10x Genomics 研發科學家:研究員 Kamila Belhocine 和資深計算生物學家 Shamoni Maheshwari。
我們了解到,Chromium 單細胞多組學 ATAC + 基因表達是從單細胞核懸液開始的。用轉座酶對大量細胞進行轉座,這種酶優先切割開放染色質區域中的核 DNA。然后將轉座后的細胞核分成液滴,也稱為 GEM,其中單個凝膠珠(Gel Bead)含有的 10x 條形碼。在 GEM 內,條形碼與單個細胞核內的 mRNA 和轉座 DNA 片段相連接。孵育后,溶解 GEM 并混合,然后進行純化、預擴增和文庫構建。混合后的 GEM 制備出兩個文庫,一個用于 RNA 測序,另一個用于 ATAC 分析。
單細胞多組學 ATAC + 基因表達的流程。通過在簡化的流程中綜合基因表達和 ATAC-seq 的數據,獲得轉錄圖譜和染色質景觀圖譜的一體化視圖。
在詳細了解工作流程以及如何實現此技術之后,我們進一步了解了他們對使用多組學來解決生物學問題有何看法。
在開發 Chromium 單細胞多組學 ATAC + 基因表達時,您試圖解決哪些研究問題?
Kamila:近年來,在單細胞水平測定基因表達讓科學家能夠前所未有地深入研究和了解生物學系統。許多基因表達的模式受到表觀遺傳程序的調控,這些程序由染色質可及性的變化所編碼,可通過 ATAC-seq 來測定。然而,盡管各個細胞狀態之間的染色質可及性差異很明顯,并且很容易被檢測到,但是如果不直接讀出這些表觀遺傳變化對基因表達的影響,也很難解釋它們。單細胞多組學 ATAC + 基因表達是先進商業化的解決方案,能夠高精度闡釋染色質可及性與基因表達之間的相互作用,從而以高分辨率了解健康與疾病狀態下的基因調控。
您能介紹一下 Cell Ranger ARC 軟件分析流程的強大功能嗎?
Shamoni:人類基因組計劃發現,人類基因組中的 1% 由基因組成。在接下來的十年,DNA 元件百科全書(ENCODE)計劃確定了近 20% 的人類基因組具有潛在的調控功能。通過鑒定單細胞中的開放染色質位點和基因表達,Cell Ranger ARC 軟件能夠在這些潛在調控區域與轉錄組之間架起橋梁。
與目標基因直接關聯的推定調控元件的鑒定。上圖來自我們的 Loupe Browser 可視化軟件,它是單細胞多組學 ATAC + 基因表達附帶的數據可視化軟件。上半部分您可以看到 LEF1 的整體關聯,這些關聯表示 1 Mb 窗口內與 LEF1 基因表達正相關(藍色弧線)或負相關(紅色弧線)的開放染色質峰,它是根據 7,273 個 PBMC 細胞核的樣本繪制的。下半部分,根據不同細胞類型對 LEF1 表達水平和開放染色質峰進行彩色標注。藍色框顯示的是基因表達和開放染色質區域具有正相關的細胞類型。紅色框顯示的是基因表達和開放染色質區域具有負相關的細胞類型。
您們認為科學家現在可以實現哪些以往不可能的發現?
Shamoni:各種批量分析,如 ENCODE 所進行的分析,已經獲得了人類基因組中調控元件的目錄。如果將我們這種方法進一步應用在各種不同類型的樣本和細胞上,研究人員就能夠高精度解析某個調控元件在哪些細胞類型或狀態中起作用及其目標基因的表達狀態。
對細胞進行分類,其實是根據所觀察到的基因表達譜的差異來劃定某些意定的邊界,據此將細胞劃分入所謂的“細胞類型”中。但是我們知道,細胞在體內具有一系列連續的狀態,其基因表達是受到多個表觀遺傳因素控制的結果。在同一細胞中同時進行基因表達和 ATAC 的分析,增加了有關細胞中基因表達程序的推定調控狀態的信息,從而能夠區分動態的細胞狀態。
科學家有望完善對非編碼變異的解釋。GWAS 研究中鑒定出的大多數 SNP 位于非編碼區。隨之而來的挑戰是解釋這種遺傳變異,并確定其功能靶點。如果非編碼 SNP 落在開放染色質峰內,則這種分析有能力揭示推定的調控區域在特定類型的細胞中是否具有活性,以及它可能調控哪些基因。
Kamila:有了單細胞多組學 ATAC + 基因表達,科學家能夠建立健康和疾病狀態下基因調控的機制,更好地了解非編碼區內遺傳破壞的影響,為擴展知識庫做出獨特貢獻,催生出改善人們生活的新型療法。
看到科學家使用您們參與開發的產品進行探索,感受如何?
Kamila:作為產品開發人員,我們致力于了解用戶的需求,并據此開發產品,以實實在在地滿足這些需求。我總是非常驚喜的看到我們產品所帶來的發現,以及其對疾病和發育的整體認識所產生的影響。我堅信,對生物學的深入理解將改善數百萬甚至數億人的健康和生活質量,隨著每一篇使用我們開發產品的文獻發表,我都認為 10x Genomics 為實現這一目標做出了有意義的貢獻。
來源 10x Genomics
總之,單細胞多組學 ATAC + 基因表達可以:
? 加深對細胞類型和細胞狀態的表征
? 結合表觀基因組學和基因表達分析揭示以前被隱藏的新見解
? 通過一次實驗中的多種讀數加速對珍貴樣本的研究
更多伯豪生物人工服務: