電話:
021-67610176傳真:
轉(zhuǎn)錄組是某個(gè)物種或者特定細(xì)胞類型產(chǎn)生的所有轉(zhuǎn)錄本的集合,轉(zhuǎn)錄組測(cè)序(RNA-seq) 是zui近發(fā)展起來的利用深度測(cè)序技術(shù)進(jìn)行轉(zhuǎn)錄分析的方法,可以對(duì)全轉(zhuǎn)錄組進(jìn)行系統(tǒng)的研究。
Roche GS FLX Titanium 、IlluminaSolexa GA IIx和AB SOLID 4均可以對(duì)轉(zhuǎn)錄組進(jìn)行測(cè)序, Roche GS FLX Titanium與IlluminaSolexa GA IIx和AB SOLID 4相比,擁有更長(zhǎng)的讀長(zhǎng)和較小的數(shù)據(jù)量,適用于表達(dá)量較高基因的RNA全長(zhǎng)測(cè)序。但是對(duì)低表達(dá)豐度的基因,可能需要多次測(cè)序才能得到足夠的數(shù)據(jù),成本比較高 ,而IlluminaSolexa GA IIx和AB SOLID 4數(shù)據(jù)讀取量大,能夠得到較高的覆蓋率,可以較好的降低成本。若是位置基因組序列的物種,則Roche GS FLX Titanium測(cè)序更有優(yōu)勢(shì),其較長(zhǎng)的讀長(zhǎng)便于拼接,獲得更好的轉(zhuǎn)錄本數(shù)據(jù)。
轉(zhuǎn)錄組測(cè)序可以供研究者在轉(zhuǎn)錄本結(jié)構(gòu)研究(基因邊界鑒定、可變剪切研究等),轉(zhuǎn)錄本變異研究(如基因融合、編碼區(qū) SNP研究),非編碼區(qū)域功能研究(Non-coding RNA研究、miRNA前體研究等),基因表達(dá)水平研究以及全新轉(zhuǎn)錄本發(fā)現(xiàn)等方面進(jìn)行深入研究。
1研究轉(zhuǎn)錄組的方法有哪些?
答:目前研究轉(zhuǎn)錄組的方法主要三種,基于雜交技術(shù)的cDNA芯片和寡聚核苷酸芯片,基于sanger測(cè)序法的SAGE (serial analysis of gene expression)、LongSAGE和MPSS(massively parallel signature sequencing),基于第二代測(cè)序技術(shù)的轉(zhuǎn)錄組測(cè)序,又稱為RNA-Seq。
2轉(zhuǎn)錄組測(cè)序比其他研究方法有哪些優(yōu)勢(shì)?
答:轉(zhuǎn)錄組測(cè)序具有以下優(yōu)勢(shì):
(1)可以直接測(cè)定每個(gè)轉(zhuǎn)錄本片段序列、單核苷酸分辨率的準(zhǔn)確度,同時(shí)不存在傳統(tǒng)微陣列雜交的熒光模擬信號(hào)帶來的交叉反應(yīng)和背景噪音問題;(2)靈敏度高,可以檢測(cè)細(xì)胞中少至幾個(gè)拷貝的稀有轉(zhuǎn)錄本;(3)可以對(duì)任意物種進(jìn)行全基因組分析,無需預(yù)先設(shè)計(jì)特異性探針,因此無需了解物種基因信息,能夠直接對(duì)任何物種進(jìn)行轉(zhuǎn)錄組分析,同時(shí)能夠檢測(cè)未知基因,發(fā)現(xiàn)新的轉(zhuǎn)錄本,并準(zhǔn)確地識(shí)別可變剪切位點(diǎn)及cSNP,UTR區(qū)域。(4)檢測(cè)范圍廣,高于6個(gè)數(shù)量級(jí)的動(dòng)態(tài)檢測(cè)范圍,能夠同時(shí)鑒定和定量稀有轉(zhuǎn)錄本和正常轉(zhuǎn)錄本。
3轉(zhuǎn)錄組測(cè)序有什么樣的樣品要求?
答: (1) 樣品純度要求: OD值應(yīng)在1.8至2.2之間;電泳檢測(cè)28S:18S至少大于1.8。 (2)樣品濃度: total RNA濃度不低于400 ng/μg。 (3)total RNA樣品請(qǐng)置于-20℃保存;請(qǐng)?zhí)峁﹖otal RNA樣品具體濃度、體積、制備時(shí)間、溶劑名稱及物種來源。請(qǐng)同時(shí)附上QC數(shù)據(jù),包括電泳膠圖、分光光度或Nanodrop儀器檢測(cè)數(shù)據(jù)。 (4)樣品請(qǐng)置于1.5 ml管中,管上注明樣品名稱、濃度以及制備時(shí)間,管口使用Parafilm封口。建議使用干冰運(yùn)輸,并且盡量選用較快的郵遞方式,以降低運(yùn)輸過程中樣品降解的可能性。
4mRNA的純化分離方法?
答:進(jìn)行mRNA研究中,首先需要對(duì)樣本進(jìn)行總RNA抽提,抽提得到的RNA除含有mRNA外,還含有rRNA和tRNA,為防止這兩類RNA對(duì)轉(zhuǎn)錄組研究的影響,因此我們需要對(duì)mRNA進(jìn)行分離純化。真核細(xì)胞的mRNA分子zui顯著的結(jié)構(gòu)特征是具有5’端帽子結(jié)構(gòu)(m7G)和3’端的Poly(A)尾巴。絕大多數(shù)哺乳類動(dòng)物細(xì)胞mRNA的3’端存在20-30個(gè)腺苷酸組成的Poly(A)尾,通常用Poly(A+)表示。這種結(jié)構(gòu)為真核mRNA的提取,提供了極為方便的選擇性標(biāo)志,寡聚(dT)纖維素或寡聚(U)瓊脂糖親合層析分離純化mRNA的理論基礎(chǔ)就在于此。 mRNA的分離方法較多,其中以寡聚(dT)-纖維素柱層析法zui為有效,已成為常規(guī)方法。此法利用mRNA 3’末端含有Poly(A+)的特點(diǎn),在RNA流經(jīng)寡聚(dT)纖維素柱時(shí),在高鹽緩沖液的作用下,mRNA被特異地結(jié)合在柱上,當(dāng)逐漸降低鹽的濃度時(shí)或在低鹽溶液和蒸餾水的情況下,mRNA被洗脫,經(jīng)過兩次寡聚(dT)纖維柱后,即可得到較高純度的mRNA。
5、使用Solexa進(jìn)行轉(zhuǎn)錄組測(cè)序時(shí),樣本RNA如何進(jìn)行片段化處理? cDNA插入片段長(zhǎng)度的選擇?
答:Solexa轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建時(shí)采用的打斷Buffer對(duì)RNA樣本進(jìn)行片段化處理,這種方法充分利用RNA對(duì)二價(jià)陽(yáng)離子的敏感性,具有穩(wěn)定性好的優(yōu)點(diǎn),通過這種方法打斷能得到更加均勻的覆蓋率。mRNA-seq可以既可以采用單端測(cè)序(single read) 還可以采用雙端測(cè)序( paired end),對(duì)于單端測(cè)序來說片段長(zhǎng)度150-200bp是理想的長(zhǎng)度范圍,對(duì)于雙端測(cè)序來說片段長(zhǎng)度推薦300-500bp,由于兩端加入了Solexa的錨定序列和引物序列,樣品準(zhǔn)備完成后所獲得的產(chǎn)物長(zhǎng)度比插入的cDNA長(zhǎng)度要長(zhǎng)。
6、文庫(kù)準(zhǔn)備過程中,反轉(zhuǎn)錄引物的選擇?
答:在進(jìn)行cDNA合成過程中,經(jīng)常用到的有兩種引物:oligodT引物和隨機(jī)引物。
在RNA反轉(zhuǎn)錄過程中使用oligodT引物進(jìn)行擴(kuò)增可以保證擴(kuò)增產(chǎn)物包括mRNA的3'末端,減少rRNA的干擾,但是采用oligodT 引物擴(kuò)增有一個(gè)問題,就是擴(kuò)增片段的長(zhǎng)度偏短和擴(kuò)增產(chǎn)物所包含的信息量偏向3’端的問題,之所以有長(zhǎng)度偏短,一方面與RNA完整性有關(guān),但zui重要的限制在于逆轉(zhuǎn)錄酶的延伸能力。 用oligodT 引物擴(kuò)增出來的片段長(zhǎng)度短,雖然都有mRNA的3'端,但是序列信息多位于3'-UTR附近,若擴(kuò)增序列太短,則有用信息很少,不利于序列的識(shí)別和分析。
使用Random primer擴(kuò)增,雖然擴(kuò)增偏短長(zhǎng)度也很短, 但是由于它的逆轉(zhuǎn)錄并不一定在mRNA的末端起始,而是在隨機(jī)位置起始,所以它的擴(kuò)增片段帶有更多CDS的信息,但是如果是用總RNA逆轉(zhuǎn)錄的話,有可能會(huì)受到rRNA的干擾。
采用Solexa進(jìn)行轉(zhuǎn)錄組測(cè)序,測(cè)序文庫(kù)準(zhǔn)備過程中,由于實(shí)驗(yàn)之前已經(jīng)采用oligodT微磁珠進(jìn)行純化,而且mRNA已經(jīng)進(jìn)行了片段化處理后才進(jìn)行反轉(zhuǎn)錄,因此反轉(zhuǎn)錄只能采用隨機(jī)引物進(jìn)行cDNA的合成,如果采用oligodT進(jìn)行擴(kuò)增,只能得到mRNA的3'端序列,無法得到完整的mRNA序列。
7、 Solexa進(jìn)行轉(zhuǎn)錄組測(cè)序,測(cè)序文庫(kù)的制備方法及質(zhì)控標(biāo)準(zhǔn)?
答:首先會(huì)樣本進(jìn)行質(zhì)量檢測(cè),檢測(cè)合格后,對(duì)樣本進(jìn)行測(cè)序前處理,構(gòu)建測(cè)序文庫(kù),構(gòu)建步驟為:(1)首先利用oligodT微珠純化mRNA;(2)將純化得到的mRNA進(jìn)行片段化處理;(3)利用逆轉(zhuǎn)錄酶反轉(zhuǎn)錄合成cDNA*鏈;(4)以cDNA*鏈為模板合成雙鏈cDNA;(5)對(duì)雙鏈cDNA進(jìn)行末端修復(fù)并在3’末端加’A”;(6)在DNA片段的兩端連接上特定的測(cè)序接頭;(7)割膠純化連接好的cDNA片段(一般回收200-500bp之間的片段);(8)利用高保真聚合酶擴(kuò)增測(cè)序文庫(kù);(9)檢測(cè)測(cè)序文庫(kù)。對(duì)于測(cè)序文庫(kù),需要進(jìn)行質(zhì)量控制,一般通過 Aligent Technologies 2100分析儀和電泳觀察兩種方法檢測(cè)測(cè)序文庫(kù)的大小,純度及濃度。
8、轉(zhuǎn)錄組測(cè)序結(jié)果的影響因素?
答:RNA的降解嚴(yán)重影響測(cè)序的質(zhì)量,RNA降解后,加入poly-A后無法捕獲純化mRNA,因此,隨機(jī)引物反轉(zhuǎn)錄無法得到全部的cDNA,導(dǎo)致測(cè)序結(jié)果出現(xiàn)明顯的3‘-和5’-偏向。文庫(kù)中的poly-A多聚物的存在會(huì)對(duì)測(cè)序信號(hào)產(chǎn)生干擾,影響測(cè)序結(jié)果的準(zhǔn)確性;同時(shí)由于轉(zhuǎn)錄組中轉(zhuǎn)錄本的豐度不一致,實(shí)驗(yàn)前需要對(duì)樣本進(jìn)行均一化處理,否則高豐度的表達(dá)基因會(huì)掩蓋低豐度表達(dá)基因,導(dǎo)致尋找新基因失敗或者是獲得大量無意義的重復(fù)序列。
9、轉(zhuǎn)錄組測(cè)序需要多大的測(cè)序量才能得到有意義的結(jié)果?
答:轉(zhuǎn)錄組測(cè)序前,需要對(duì)物種轉(zhuǎn)錄組的大小進(jìn)行評(píng)估,評(píng)估方法如下: (1)對(duì)于有reference genome的物種,可以分析基因組信息,統(tǒng)計(jì)編碼基因的個(gè)數(shù),及其堿基數(shù),從而估計(jì)物種轉(zhuǎn)錄組的大小,另外可以查詢相關(guān)或相近物種轉(zhuǎn)錄組研究的文獻(xiàn),作為參考。
(2)對(duì)于無reference genome的物種則只能參考相近物種的轉(zhuǎn)錄組大小。
由于轉(zhuǎn)錄組需要進(jìn)行表達(dá)量的分析,因此在轉(zhuǎn)錄組測(cè)序中不推薦覆蓋度,在進(jìn)行不同基因和不同實(shí)驗(yàn)間的基因表達(dá)差異分析時(shí),人們提出了RPM和RPKM的概念。 RPM(Reads Per Million reads)即每百萬reads中來自于某基因的reads數(shù),考慮了測(cè)序深度對(duì)讀段計(jì)數(shù)的影響。RPKM(Reads Per Kilo bases per Million reads)是每百萬reads中來自于某基因每千堿基長(zhǎng)度的reads數(shù)。因此,在確定轉(zhuǎn)錄組的測(cè)序量時(shí),以產(chǎn)生的讀長(zhǎng)數(shù)目做依據(jù),參照轉(zhuǎn)錄組大小,估計(jì)需要的讀長(zhǎng)數(shù)目,來確定轉(zhuǎn)錄組需要的測(cè)序量。
10、如何處理轉(zhuǎn)錄組測(cè)序中存在的系統(tǒng)噪音和偏差?
答:雖然深度測(cè)序技術(shù)的準(zhǔn)確性較以前的技術(shù)有了很大提高,但仍然存在錯(cuò)誤和噪聲。比如內(nèi)含子區(qū)內(nèi)有一些不連續(xù)的reads,很可能由系統(tǒng)噪聲造成,如樣品污染、測(cè)序錯(cuò)誤和不恰當(dāng)?shù)膔ead定位策略等。另外,外顯子區(qū)域內(nèi)的read信號(hào)分布有時(shí)也很不均勻。有文獻(xiàn)報(bào)道,序列組成尤其是GC含量、RNA二級(jí)結(jié)構(gòu)等也有可能是導(dǎo)致read不均勻分布的原因。這些噪聲和分布偏好將影響新基因的識(shí)別和對(duì)剪接異構(gòu)體形式和表達(dá)水平推斷。 合理地建模RNA-seq數(shù)據(jù)中的系統(tǒng)噪聲和偏好是解決上述問題zui有效的辦法。基本的思路可以是:首先根據(jù)實(shí)驗(yàn)原理尋找可能產(chǎn)生系統(tǒng)噪音或偏差的因素,并盡可能將這些因素轉(zhuǎn)化成可量化的特征,如序列特征、二級(jí)結(jié)構(gòu)等;然后,將用實(shí)驗(yàn)數(shù)據(jù)對(duì)這些特征做統(tǒng)計(jì)分析,構(gòu)造和訓(xùn)練模型,用模型來對(duì)數(shù)據(jù)進(jìn)行校正。需要注意的是,某些偏好是由當(dāng)前的測(cè)序技術(shù)和分析方法共同造成的,難以*消除。在這種情況下,后續(xù)處理和解釋時(shí)需要充分意識(shí)到這種偏好可能對(duì)生物學(xué)結(jié)論帶來的影響,必要時(shí)通過補(bǔ)充其他實(shí)驗(yàn)來驗(yàn)證和修正通過高通量測(cè)序得到的生物結(jié)論。