Irys單分子基因組結構成像系統
讓我們組織,而不是堆砌數據
在過(guò)去的幾年里,二代測序的高通量***直主導著(zhù)基因組研究的發(fā)展。
但是二代測序技術(shù)可以廉價(jià)的獲得大量的測序數據,但是受制于較短的讀長(cháng),這使得科學(xué)***們無(wú)法簡(jiǎn)單而直觀(guān)地看到整個(gè)基因組范圍的結構變化?,F在,針對更長(cháng)片段的分析方法對于基因組結構研究顯得越來(lái)越重要。另外,由于基因組的復雜性,諸如重復序列和結構變異,限制了基因組的重構和對功能元件的理解。Irys系統克服了這些困難,利用***種新的方法去獲取單分子,尤其是長(cháng)鏈DNA分子的圖像。
長(cháng)鏈DNA分子
Irys系統的核心是已經(jīng)獲得專(zhuān)利的芯片技術(shù)。這種芯片可以使盤(pán)繞的DNA長(cháng)鏈隨機解開(kāi)、拉直,進(jìn)入納米***通道。這些納米通道可以防止半卷曲的DNA分子重新纏繞,并且將大量長(cháng)鏈DNA分子拉直,平行排列在***起直接拍照成像(圖1)。
IrysPrep 試劑盒可以通過(guò)限制性?xún)惹忻冈谔禺愇稽c(diǎn)進(jìn)行剪切,然后連接上帶有熒光的堿基使長(cháng)鏈DNA分子被標記。軟件會(huì )將長(cháng)鏈上的熒光點(diǎn)翻譯成相應的序列信息,以幫助組裝基因組圖譜。成像后,DNA分子會(huì )從納米通道中排出,新***批的DNA分子會(huì )進(jìn)入。這種動(dòng)態(tài)的,多循環(huán)的技術(shù)使Irys系統可以實(shí)現每小時(shí)內完成幾個(gè)GB的DNA分子的線(xiàn)性化和成像。
圖1:長(cháng)鏈DNA分子在納米通道中平等排列,生成高質(zhì)量的圖像
關(guān)聯(lián)的基因組
在單分子水平上對全基因組結構的可視化,不但可以減少了由于DNA擴增和打斷等引起的偏差,而且也為***個(gè)全基因組的物理圖譜提供了骨架,使測序結果更有效,更完整。在圖譜中,長(cháng)序列的基因組結構得以保存,這對發(fā)現生物學(xué)上特異的結構變異是很有裨益的。Irys所測讀的超長(cháng)片段,對于全基因組圖譜的構建,連接功能單元,錨定contigs,確定gap的大小,衡量重復單元的大小,分辨拷貝數變化,插入片段以及異位都是非常必要的。
應用
IrysPrep試劑盒和IrysView軟件分析系統支持結構變異檢測,組裝驗證,骨架和NGS數據以及客戶(hù)自定義的***些長(cháng)片段單分子數據。
結構變異分析
Irys是***款非常適合做結構變異分析的儀器。NGS的短讀長(cháng)不僅在de novo測序數據的拼裝上存在困難,也限制了其在CNVs方面的應用。而其他的方法,比如array-CGH,缺少位置信息而且依賴(lài)于探針,因此只能應用在已有參考序列的模式物種上。Irys通過(guò)長(cháng)讀長(cháng),實(shí)現了基因組范圍內的結構變異檢測。長(cháng)鏈基因組的自然狀態(tài),染色體平衡異位以及插入(重復)具體位置信息都可以被直接觀(guān)察到。(圖2)另外,利用單分子檢測,而不是NGS和CGH數據的疊加,可以讓群體中的每個(gè)個(gè)體都能夠被直接檢測到。
圖2:直觀(guān)的變異位點(diǎn)分析。通過(guò)和果蠅的參考序列(綠色)比對,可以準確的發(fā)現拷貝數的多態(tài)性(串聯(lián)重復),該果蠅只有單拷貝(藍色),并且通過(guò)高覆蓋度得到了驗證。
NGS錨定
Irys在de novo應用中可以拼裝出更加完整的數據,和NGS相比,可以在更短時(shí)間內提供更完整的基因圖譜。任何短讀長(cháng)的測序方法都會(huì )造成重復序列很難被正確組裝,而Irys特有的超長(cháng)片段讀長(cháng),完全可以跨越重復片段和***些包含復雜元件的序列,能夠使contig數量和gap數量大大減少(圖3)。
其他***些基于限制性?xún)惹忻傅拈L(cháng)片段讀取方法會(huì )丟失***些小的片段(比如重復序列),但是Irys系統的剪切和加標簽的化學(xué)方法完全不會(huì )破壞DNA長(cháng)鏈結構。(圖4)
圖3:NGS組裝。人類(lèi)MHC區域通過(guò)NGS獲得5個(gè)contigs,通過(guò)Irys系統,可以準確地確定它們在基因組中的位置及gaps的大小。(Lam et al, Nature Biotech, 2012).
圖4:長(cháng)鏈單分子DNA可通讀重復片段。酵母的著(zhù)絲粒區含有很多重復片段,參考序列中并沒(méi)有完整地呈現它的拷貝數,Irys系統可以通讀長(cháng)鏈單分子DNA片段,使這***結果清晰呈現。
組裝驗證
Irys系統得到的基因組圖譜可以與NGS數據拼裝出的基因組圖譜實(shí)現非常完美的交叉驗證。在IrysView軟件中,可以在圖表瀏覽器中看到與已導入的NGS的組裝序列的差異,并且以表格的形式列出,這有助于研究人員進(jìn)行更深層的單分子成像的研究,同時(shí),Irys還可以幫助科研人員快速地設計新的驗證及測序實(shí)驗。
在IrysPrep試劑的支持下,Irys系統可以作為***個(gè)開(kāi)放的平臺為研究人員提供多種形式的遺傳分析?;贗rys系統的長(cháng)鏈單分子熒光標記方法,更多領(lǐng)域的應用都在不斷的研發(fā)中。