狼人色国产在线视频爱雨网_一级AAAAA毛片免费_在线看h片z在线看_濑亚美莉大战黑人中文字幕_了解最新欧美日韩另类国产_国产亚洲精品视频免费播放_伊人色综合久久天天影院网_2020免费观看黄片_三级精品少妇影视_日韩一区亚洲专区在线观看

農(nóng)業(yè)基因組學(xué)解決方案
日期:2017-05-15 11:41:54

農(nóng)業(yè)基因組學(xué)解決方案

適合您所有研究階段的平臺(tái)

來自Affymetrix的農(nóng)業(yè)基因組學(xué)解決方案為育種者和研究人員提供了一系列強(qiáng)大而靈活的基因分型工具,可經(jīng)濟(jì)高效地鑒定、驗(yàn)證并篩查植物和動(dòng)物中的復(fù)雜遺傳性狀。


Affymetrix的遺傳分析工具讓您有能力:

發(fā)現(xiàn)

通過遺傳分析技術(shù)確定de novo遺傳多樣性

分析群體結(jié)構(gòu)


關(guān)聯(lián)

鑒定與理想性狀相關(guān)的遺傳標(biāo)記

確認(rèn)標(biāo)記-性狀關(guān)聯(lián)

了解對(duì)環(huán)境的遺傳適應(yīng)性


管理

利用遺傳信息來選取期望的結(jié)果

篩查植物和動(dòng)物的理想性狀


基于芯片的基因分型的優(yōu)點(diǎn):

經(jīng)濟(jì)

經(jīng)濟(jì)高效的基因分型工具


簡單

在單個(gè)技術(shù)平臺(tái)上結(jié)合多個(gè)基因分型應(yīng)用

輕松且簡單的流程

幾小時(shí)內(nèi)即可獲得準(zhǔn)確的結(jié)果


靈活

高通量的基因分型工具適合高密度或靶向基因分型應(yīng)用

能基因分型所有您感興趣的相關(guān)的標(biāo)記

低樣品量需求


來自Affymetrix的基于芯片的基因分型產(chǎn)品為從全基因組分析到常規(guī)篩查的各種應(yīng)用提供了完整的解決方案,且準(zhǔn)確性和重復(fù)性高、流程簡單、成本低。


Axiom?基因分型解決方案為您提供多種芯片。您可以選擇要研究物種的自定義內(nèi)容,也可以選擇來自Axiom?基因組數(shù)據(jù)庫的基因型經(jīng)過驗(yàn)證的內(nèi)容。


強(qiáng)大

■ 對(duì)任何物種、任何基因組規(guī)模和任何倍性水平進(jìn)行基因分型

■ Axiom?分析可檢測插入或缺失(indel)并保證包含所有候選SNP,與相鄰SNP最近可達(dá)10 bp,實(shí)現(xiàn)了更高效的QTL分析


可靠

■ 低至100 ngDNA,即可獲得基因分型結(jié)果,適用于各種樣本類型

■ 基因型檢出率≥99%


擴(kuò)展

■ 完全自動(dòng)化的流程,每周可處理最多8張芯片板,而無需增加人工或儀器

■ 一張芯片板上有96個(gè)或384個(gè)樣本

■ 檢測每個(gè)樣品多達(dá)260萬個(gè)變異




植物基因分型解決方案

自動(dòng)化檢出多倍體和二倍體基因型,無須手動(dòng)操作

Affymetrix與學(xué)術(shù)研究機(jī)構(gòu)和商業(yè)種子公司的科學(xué)家們合作,為多種植物設(shè)計(jì)芯片,包括水稻、小麥、玉米、土豆、西紅柿、棉花、大豆、草莓、及景觀植物。這些芯片讓研究人員能夠鑒定出與理想的表型性狀相關(guān)的基因。

blob.png

■ Affymetrix已開發(fā)出先進(jìn)的基因型算法和軟件工具,能對(duì)非二倍體復(fù)雜基因組自動(dòng)分析

■ 該算法提供了可調(diào)的參 數(shù),可對(duì)近交系群體及基因組偏離參考序列的樣品 進(jìn)行準(zhǔn)確分型

blob.png

Axiom?玉米基因分型芯片

■ 目前唯一一款高密度覆蓋玉米SNP位點(diǎn)的基因分型芯片,包含609,442個(gè)SNP和6,759個(gè)插入/缺失。

■ 這些標(biāo)記在288個(gè)世界主要的不同品系玉米樣本上進(jìn)行包含120萬個(gè)SNP位點(diǎn)的Axiom? myDesign? GenotypingArray的篩選獲得。

■ AffymetrixSNPolisher? Analysis對(duì)SNP進(jìn)行準(zhǔn)確的分型。



blob.png

Axiom?小麥基因分型芯片

■ 高覆蓋度的小麥基因分型芯片。采用96芯片板模式,與布里斯托大學(xué)合作,為全球小麥品系所設(shè)計(jì),包含817,000個(gè)SNP位點(diǎn),覆蓋整個(gè)小麥基因組,大大加速現(xiàn)代小麥分子育種進(jìn)程。

■ 經(jīng)育種研究人員精心挑選,在優(yōu)良小麥品系六倍體中表現(xiàn)多態(tài)性,包括了國際小麥測序協(xié)會(huì)(IWGSC)所確定的片段重疊群的SNP標(biāo)記,共35,143個(gè)標(biāo)記,分布于A、B和D基因組中。



blob.png

Axiom?棉花基因分型芯片

棉花基因分型芯片總共包含35,550個(gè)標(biāo)記

■ 28,158個(gè)利用陸地棉(G. hirsutum)的基因富集序列區(qū)域鑒定出的種內(nèi)特異性標(biāo)記。

■ 7,392個(gè)利用基因組簡化方法發(fā)現(xiàn)的標(biāo)記,基于限制性酶切位點(diǎn)的保守性(GR-RSC)。

■ 5,286個(gè)在陸地棉(G. hirsutum)和海島棉(G. barbadense)種間組裝過程中發(fā)現(xiàn)的標(biāo)記。

■ 2,016個(gè)陸地棉(G. hirsutum)種內(nèi)特異性標(biāo)記。

■ 芯片上可以添加380,000個(gè)定制標(biāo)記,或以100%的保真度向Axiom? 384HT myDesign?育種者芯片上轉(zhuǎn)移多態(tài)性標(biāo)記,以應(yīng)

對(duì)不同群體的樣本研究和分析的需要。



blob.png

Axiom?大豆基因分型芯片

總共180,961個(gè)標(biāo)記選自20條大豆染色體,代表野生種和栽培種

■ 114,735個(gè)SNP或63.4%的標(biāo)記位于40,631個(gè)基因中。

■ 22,952個(gè)SNP位于基因上游或下游5kb的13,259個(gè)區(qū)域內(nèi)。

■ 43,274個(gè)SNP位于基因間區(qū)域。

■ SNP的發(fā)現(xiàn)和驗(yàn)證是利用韓國16個(gè)大豆品種和中國31個(gè)大豆品種的組合來完成的。

■ 此芯片經(jīng)過228個(gè)品系組合的評(píng)估,這些品系包括高深度的重測序品系、不同來源的重復(fù)DNA樣本、重復(fù)DNA樣本、不同的栽培和野生品系,以及多個(gè)F2代和重組自交系。


blob.png

Axiom?草莓基因分型芯片

芯片對(duì)栽培種雜交草莓(Fragaria x ananassa)全基因組進(jìn)行覆蓋

■ 95,062個(gè)來自八倍體和二倍體品種的SNP和插入缺失,包括:1,761個(gè)復(fù)等位基因SNP和3,751個(gè)來自二倍體品種的SNP。

■ 代表多個(gè)草莓品種,多樣化的全球育種種質(zhì)資源集促進(jìn)了SNP的開發(fā)。

■ SNP的發(fā)現(xiàn),通過超過20倍覆蓋度對(duì)9個(gè)八倍體品種進(jìn)行測序分析,包括Holiday、Korona以及Holiday與Korona雜交的F1幼苗;兩個(gè)可能的二倍體祖先,F(xiàn)ragariamandschurica和F. iinumae;一個(gè)已知的二倍體品種,F(xiàn). vesca測序數(shù)據(jù)與F. vesca基因組序列進(jìn)行比對(duì)。




blob.png

Axiom?玫瑰基因分型芯片

■ Axiom?玫瑰基因分型芯片(WagRhSNP Axiom Array)是通過Affymetrix?專家設(shè)計(jì)項(xiàng)目與荷蘭瓦格寧根大學(xué)植物育種組和德

國萊布尼茨大學(xué)植物遺傳學(xué)研究所合作設(shè)計(jì)的。

■ 總共68,893個(gè)SNP,它們精選自四倍體鮮切花玫瑰和花園玫瑰品種。

■ 應(yīng)對(duì)玫瑰的復(fù)雜性狀研究:多倍體連鎖圖譜,SNP單倍型鑒定,重要表型性狀相關(guān)聯(lián)的QTL分析。

■ 672個(gè)樣本利用Axiom 玫瑰基因分型芯片進(jìn)行了基因分型驗(yàn)證,包括:四倍體鮮切花玫瑰群體K5,四倍體花園玫瑰,倍性水平從二倍體(2x)到五倍體(5x)的13個(gè)品種。


blob.png
Axiom? myDesign? 基因分型定制芯片

靈活、經(jīng)濟(jì)高效的基因分型定制芯片

Affymetrix為研究人員個(gè)人或協(xié)作組提供經(jīng)濟(jì)的基因分型定制芯片。與我們的生物信息學(xué)團(tuán)隊(duì)合作,為多個(gè)應(yīng)用(從發(fā)現(xiàn)到查)設(shè)計(jì)帶有相關(guān)內(nèi)容的芯片。

每批一致的SNP內(nèi)容和快速的周轉(zhuǎn)時(shí)間

■ 每一筆訂單獲得100%相同的SNP內(nèi)容,只要您的研究需要

■ 無SNP丟失-每次芯片上的內(nèi)容都一致靈活的定制格式

靈活的定制格式

■ 可在同一張芯片上包含多個(gè)物種的標(biāo)記

■ 每張芯片上可設(shè)計(jì)1,500-675,000個(gè)SNP的多重分析,性價(jià)比高,讓您獲得更多信息可擴(kuò)展性

可擴(kuò)展性

■ 480個(gè)樣品的低起定量可滿足您的預(yù)算

■ 再次訂購低至192個(gè)樣品的定制芯片,以完成您的研究


blob.png

blob.png



軟件自動(dòng)檢出多倍體及二倍體基因型

通過專業(yè)的生物信息學(xué)支持和簡化的軟件,大大加速您的分析流程

強(qiáng)大的信息學(xué)支持

■ Axiom?軟件利用統(tǒng)計(jì)學(xué)聚類預(yù)測工具FitAllo及AxiomGT1算法,能準(zhǔn)確并靈活地將基因型區(qū)分聚類,并

檢出多倍體及二倍體的基因型

與您現(xiàn)有的系統(tǒng)整合

■ 自動(dòng)化程度高的選項(xiàng):基于命令行的Affymetrix? PowerTools(APT)

■ 無縫整合第三方軟件包

■ 與32位和64位的Windows? 7和Windows Server 2008操作系統(tǒng)兼容

簡化的數(shù)據(jù)分析

■ 包括靈活的SNP過濾和輸出工具,可輸出成PLINK格式

■ 可視化工具包括散點(diǎn)圖、曲線圖和熱圖

■ SNPolisher軟件包能將SNP自動(dòng)分類,方便您對(duì)基因型質(zhì)控(如下圖所示)

blob.png

農(nóng)業(yè)基因組學(xué)項(xiàng)目合適的平臺(tái)選擇

不犧牲數(shù)據(jù)質(zhì)量和周轉(zhuǎn)時(shí)間

新一代測序的快速發(fā)展幫助農(nóng)業(yè)科學(xué)家建立起基因組的廣泛資源,這將打造成一個(gè)“基因組文庫的生動(dòng)世界”??蒲袑W(xué)者、動(dòng)物育種專家和商業(yè)種子公司都開始涉足這個(gè)龐大的基因組文庫資源,從而加強(qiáng)農(nóng)業(yè)基因組學(xué)策略。通過應(yīng)用基因組標(biāo)記來鑒定和選

擇重要性狀,他們的目標(biāo)是提高生產(chǎn)力和商業(yè)可行性。本技術(shù)指南整合了同行評(píng)議的雜志中介紹的基于序列的基因分型方法的經(jīng)驗(yàn),并比較了芯片在農(nóng)業(yè)基因分型應(yīng)用中的表現(xiàn),以便協(xié)助您作出 基因分型技術(shù)的決策。


基于序列的基因分型概述

基因組選擇和關(guān)聯(lián)作圖或連鎖不平衡(LD)定位技術(shù)需要大量的標(biāo)記,才能準(zhǔn)確估計(jì)與基因型相關(guān)聯(lián)的性狀。這就要求獲得基因型信息所使用的技術(shù)必須是經(jīng)濟(jì)高效,且高通量的。全基因組測序以及利用序列捕獲的靶向基因分型比較昂貴,而產(chǎn)生基因型數(shù)據(jù)的低通量方法對(duì)于常規(guī)應(yīng)用而言仍然是不實(shí)際的。在確定經(jīng)濟(jì)型測序的目標(biāo)下,基于測序的基因分型方法,如基于酶切的簡化DNA測序1 (RADseq)和genotyping-by-sequencing (GBS) 2已不斷發(fā)展,它們?cè)诳蒲泻腿粘?yīng)用中的潛力被不斷引用。


基于測序的方法依賴于對(duì)多個(gè)樣品添加條形碼,并降低基因分型的成本。這種技術(shù)利用限制性內(nèi)切酶來消化目標(biāo)限制位點(diǎn)和低拷貝基因組區(qū)域,以降低基因組復(fù)雜度。這樣就能夠避免帶有重復(fù)序列的區(qū)域,它們?nèi)菀桩a(chǎn)生模糊或假的SNP,且增加測序成本。利用測序而獲得的基因型數(shù)據(jù)在質(zhì)量和數(shù)量上大有不同,這高度依賴于生物體的基因組大小和結(jié)構(gòu)以及評(píng)估的群體?;蚪M結(jié)構(gòu)的復(fù)雜度,如倍性水平、GC含量和重復(fù)序列、待研究群體的遺傳多樣性,以及群體內(nèi)的交配系統(tǒng),都對(duì)測序技術(shù)準(zhǔn)確輕松收集基因型數(shù)據(jù)的成本、準(zhǔn)確性和效率有著直接的影響。對(duì)于那些標(biāo)記探索落后或不完善的物種而言,基于測序的基因分型技術(shù)很有用。GBS和RADseq都能用于至少96個(gè)樣品,而不需要訪問參考數(shù)據(jù)庫或之前發(fā)現(xiàn)的標(biāo)記。這種技術(shù)還特別適合篩查數(shù)千個(gè)多態(tài)性,以了解遺傳變異的后果,之前人們依賴極其少量的標(biāo)記,如微衛(wèi)星和擴(kuò)增片段長度多態(tài)性(AFLP)。基于測序的基因分型技術(shù)已被用于標(biāo)記的發(fā)現(xiàn)。雜志上已經(jīng)發(fā)表了在多個(gè)物種上開展的各種實(shí)驗(yàn)的結(jié)果,如大麥、玉米、小麥、牛和鱒魚等。在常規(guī)的基因分型中使用基于測序的基因分型技術(shù)依然遙遙無期,這有幾方面的原因,本文中也列出了其中一些。《Molecular Ecology》雜志關(guān)于genotyping-by-sequencing技術(shù)的特刊3也總結(jié)指出,新的genotyping-by-sequencing技術(shù)仍然是不完善的,無法在不同的植物和動(dòng)物中充分地?cái)U(kuò)展。


基于序列的基因分型中的關(guān)鍵實(shí)驗(yàn)因素

所有的新一代測序平臺(tái)都有序列堿基數(shù)量的限制,它們由每個(gè)測序運(yùn)行產(chǎn)出。這個(gè)有限的產(chǎn)出能力意味著基于測序的基因分型運(yùn)行必須平衡四個(gè)關(guān)鍵參數(shù):樣品多重分析的水平、基因組覆蓋度、序列覆蓋度以及每個(gè)樣品的成本。樣品的多重分析很關(guān)鍵,因?yàn)闇y序儀的有限產(chǎn)出能力必須由運(yùn)行中包括的所有樣品來共享。更多樣品意味著每個(gè)樣品的測序堿基更少。

基因組覆蓋度也很重要,因?yàn)樗鼪Q定了被分析基因組的百分比,因此,也決定了基因組中可獲取的標(biāo)記數(shù)量。更高的基因組覆蓋度是以犧牲其他參數(shù)中的一個(gè)為代價(jià)而實(shí)現(xiàn)的,因?yàn)樗枰嗟臏y序儀產(chǎn)出能力。

blob.png

序列覆蓋度(或序列“深度”)決定了數(shù)據(jù)集中每個(gè)序列的平均讀取數(shù)量。實(shí)際上,一些序列頻繁被讀取,而一些較少被讀取,或根本沒有。序列覆蓋度影響數(shù)據(jù)中缺口的百分比以及基因型準(zhǔn)確性。準(zhǔn)確的基因型檢出通常需要每個(gè)SNP上30倍或更高的覆蓋度。增加序列覆蓋度也迫使在其他地方妥協(xié),以平衡測序儀能力的使用。當(dāng)然,樣品多重分析、基因組覆蓋度和序列覆蓋度都能通過在測序儀上投入更多運(yùn)行來改善,但這會(huì)使成本迅速增加。本技術(shù)指南討論了每種新型測序技術(shù)中實(shí)驗(yàn)方法的影響、基因組復(fù)雜度對(duì)標(biāo)記數(shù)量的影響,以及應(yīng)用范圍。實(shí)驗(yàn)方法的變化可明顯增加任何基因分型項(xiàng)目的成本,對(duì)于30,000個(gè)標(biāo)記的項(xiàng)目,可能增加五倍 。


應(yīng)用

基因組覆蓋度高度依賴于基因分型技術(shù)和方法的選擇,而這個(gè)選擇取決于感興趣的應(yīng)用。每種方法提供了不同水平的植物或動(dòng)物基因組覆蓋度。這影響了可獲取的標(biāo)記數(shù)量,也決定了哪種方法適合目標(biāo)應(yīng)用。這些應(yīng)用的范圍從群體基因組掃描到確定系統(tǒng)發(fā)育。圖2顯示了不同的基于測序和芯片的基因分型方法如何定位到各種應(yīng)用,以及與覆蓋基因組相關(guān)的相對(duì)成本。每種基于測序的方法所覆蓋的標(biāo)記數(shù)量取決于實(shí)驗(yàn)參數(shù),如限制性內(nèi)切酶的類型、DNA的質(zhì)量和數(shù)量以及分析技術(shù)。每個(gè)應(yīng)用的標(biāo)記數(shù)量如圖2所示,是被測序的基因組部分的函數(shù)。準(zhǔn)確基因分型所需的標(biāo)記數(shù)量是基因組水平的連鎖不平衡的數(shù)量、系譜中捕獲的重組事件、各組之間分歧的函數(shù)。4通過改變分析中的限制性內(nèi)切酶,以增加標(biāo)簽數(shù)量,可提高基因組覆蓋度。然而,正如上文指出的,提高基因組覆蓋度是以更低的樣品多重分析、更低的序列覆蓋度或每個(gè)樣品的更高成本為代價(jià)的。

blob.png

群體基因組掃描和測序驗(yàn)證:芯片和基于測序的基因分型技術(shù)已經(jīng)用于開展群體掃描和驗(yàn)證那些利用新一代測序發(fā)現(xiàn)的標(biāo)記?;跍y序的基因分型策略容易檢出假的SNP,因?yàn)闇y序技術(shù)存在固有誤差,拷貝數(shù)變異無法定位到參考基因組,或來自旁系同源或同源基因。通過更深度的序列覆蓋,假的SNP可排除,但這會(huì)增加每個(gè)樣品的成本,通過使用雙單倍體或高質(zhì)量的參考序列,也可避免這一問題,但這些會(huì)導(dǎo)致更復(fù)雜的信息學(xué)分析,而嚴(yán)格的過濾條件會(huì)丟棄大部分的測序數(shù)據(jù)。通過運(yùn)行群體內(nèi)的大量樣品來驗(yàn)證標(biāo)記,可鑒定出信息量大且重復(fù)的標(biāo)記。高密度的Axiom?芯片已成功應(yīng)用于驗(yàn)證測序發(fā)現(xiàn)和排除假的SNP,這些SNP是許多物種測序錯(cuò)誤的結(jié)果,包括雞5和三文魚6。芯片帶來了一種簡單的方法,可以評(píng)估不同群體中的數(shù)百萬個(gè)標(biāo)記,并驗(yàn)證那些通過不同測序技術(shù)(如RADseq、RNAseq和重測序)發(fā)現(xiàn)的標(biāo)記。


關(guān)聯(lián)作圖、基因組選擇和拷貝數(shù)應(yīng)用:關(guān)聯(lián)作圖(AM)技術(shù)使用大量的多態(tài)性標(biāo)記來克服QTL定位中的挑戰(zhàn)和限制。關(guān)聯(lián)作圖依賴連鎖不平衡和現(xiàn)有基因庫中存在的重組,來開展隨機(jī)交配群體、各系或種質(zhì)間的表型-基因型關(guān)聯(lián)。8 在關(guān)聯(lián)作圖研究中,更多的標(biāo)記增加了找到或定位致病變異的可能性,9 因此標(biāo)記越多越好。盡管關(guān)聯(lián)作圖可通過基于測序的基因分型方法來完成,但芯片通常能更經(jīng)濟(jì)高效地對(duì)高密度的標(biāo)記進(jìn)行基因分型,且有著更好的數(shù)據(jù)質(zhì)量和完整性。


密集的標(biāo)記也可用在基因組選擇中,其中在基因分型和表型檢測中同時(shí)估計(jì)標(biāo)記的影響,或訓(xùn)練群體,然后用來預(yù)測選擇候選物的價(jià)值?;蚪M選擇的準(zhǔn)確性隨標(biāo)記密度的增加而增加。據(jù)估計(jì),50,000個(gè)標(biāo)記已足以準(zhǔn)確預(yù)測這些關(guān)系。10 拷貝數(shù)變異檢測實(shí)現(xiàn)了復(fù)雜性狀中可遺傳變異的研究和鑒定。


系譜和數(shù)量性狀位點(diǎn)(QTL)作圖:與關(guān)聯(lián)作圖不同,QTL作圖查看多個(gè)基因?qū)?shù)量性狀的影響,如三文魚控制對(duì)海虱的抗性或魚卵大小的QTL。QTL鑒定是基于雙親雜交,需要通過精細(xì)作圖鑒定染色體區(qū)域的單個(gè)基因,因此需要大量的雜交來產(chǎn)生足夠數(shù)量的減數(shù)分裂事件。系譜基因分型利用QTL檢測中的育種材料,它們覆蓋多代,通過多次雜交與系譜中的共同祖先相關(guān)聯(lián)。這實(shí)現(xiàn)了育種項(xiàng)目中存在的大部分等位基因的鑒定和使用。


系統(tǒng)發(fā)育和群體定位:在各個(gè)研究機(jī)構(gòu)維護(hù)的種質(zhì)和育種者維護(hù)的種質(zhì)中,群體結(jié)構(gòu)可能有所不同。不同的群體結(jié)構(gòu)需要不同的全基因組關(guān)聯(lián)研究(GWAS)方法。通過構(gòu)建遺傳或連鎖圖譜來調(diào)查群體結(jié)構(gòu)和開展系統(tǒng)發(fā)育分析,可提供基因組重組率的信息。了解群體結(jié)構(gòu)也有助于選擇適當(dāng)?shù)臉?biāo)記和密度。通過研究很小一部分基因組中的標(biāo)記,可完成群體分析。


工作流程:基于芯片的技術(shù)和基于測序的基因分型技術(shù)的工作流程比較如圖3所示。基于測序的基因分型技術(shù)依賴條形碼技術(shù)對(duì)樣品進(jìn)行多重分析(例如,96個(gè)樣品在單個(gè)通道中測序?qū)⑿枰?6個(gè)樣品條形碼)。文庫制備需要選擇適合該物種和所需標(biāo)記數(shù)量的限制性內(nèi)切酶。此過程需要優(yōu)化,以避免引物二聚體等問題,這些可能增加測序的費(fèi)用。在文庫制備之后,真正的測序約需11個(gè)小時(shí)至11天不等,這取決于儀器的能力和測序基因組的百分比。更高的樣品多重分析也并非不可能,但正如之前提到的,必須平衡基因組大小,測序基因組的百分比以及單個(gè)通道中的序列覆蓋度。測序之后,數(shù)據(jù)經(jīng)過過濾,條形碼被解復(fù)用,以提取每個(gè)樣品的標(biāo)記。使用任一基因分型技術(shù)的重要考慮因素是計(jì)算設(shè)備和分析流程。分析流程需要根據(jù)感興趣的物種、實(shí)驗(yàn)方法、待研究的群體和技術(shù)本身來定制。

James Hutton研究所近期發(fā)表的一篇文章11得出結(jié)論,利用GBS來研究大麥的一個(gè)重要結(jié)果是,與目前實(shí)驗(yàn)室中使用的多重SNP分析技術(shù)相比,GBS數(shù)據(jù)在處理和隨后的分析上更具挑戰(zhàn)性。采用基于測序的基因分型技術(shù)存在諸多挑戰(zhàn),包括計(jì)算設(shè)備,維護(hù)定制分析流程的生物信息學(xué)專家,開展比對(duì)和分析的軟件,以及提取有用的基因分型數(shù)據(jù)所需的時(shí)間。測序技術(shù)的數(shù)據(jù)分析通常在“云端”開展,以盡量減少本地?cái)?shù)據(jù)存儲(chǔ)和計(jì)算要求。變異檢出往往通過定制的軟件來開展,這些軟件檢出各種基因型。每個(gè)存儲(chǔ)技術(shù)都具有與數(shù)據(jù)轉(zhuǎn)移、存儲(chǔ)和檢索相關(guān)的成本,這會(huì)影響基因分型項(xiàng)目的成本。

相比之下,基于芯片的基因分型技術(shù)能輕松地利用臺(tái)式工作站,對(duì)每個(gè)樣品的數(shù)百萬個(gè)數(shù)據(jù)點(diǎn)進(jìn)行基因分型,在降低設(shè)備費(fèi)用的同時(shí)提高操作效率。這種芯片法基因分型的簡約、易用讓芯片可在各種場景和環(huán)境下使用,對(duì)常規(guī)育種應(yīng)用而言尤其有吸引力,因?yàn)榇罅繕悠诽幚砗椭苻D(zhuǎn)時(shí)間都很重要。

文庫制備中的DNA質(zhì)量和數(shù)量:基于測序的基因分型技術(shù)對(duì)DNA濃度和DNA質(zhì)量的要求仍然是實(shí)際應(yīng)用中的嚴(yán)重挑戰(zhàn)之一。DNA測序需要幾微克(μg)已純化的高分子量基因組DNA,且無污染和共生體。細(xì)菌污染可能影響測序,因?yàn)镈NA材料的隨機(jī)擴(kuò)增意味著細(xì)

菌DNA會(huì)與待分型的生物樣品一起被測序。

標(biāo)記的數(shù)量和類型:芯片技術(shù)與測序技術(shù)的最大差異在于芯片靶定特定的基因組區(qū)域或特定SNP的能力,如圖4所示?;谛酒募夹g(shù)能夠靶定特定染色體區(qū)域內(nèi)任何數(shù)量的標(biāo)記,其設(shè)計(jì)策略采用在基因組中均勻間隔的標(biāo)記,如有必要,采用基因組特定區(qū)域內(nèi)更高間隔的標(biāo)記。這種靈活性讓芯片可應(yīng)用于GWAS、12 QTL作圖、關(guān)聯(lián)作圖和基因組選擇,并具有一定量的確定偏差。通過在多個(gè)品種上開展SNP研究,可降低確定偏差。

blob.png

表1:利用芯片和基于測序的基因分型技術(shù)對(duì)生物樣品進(jìn)行基因分型所需的DNA量。基于測序的基因分型技術(shù)所需的濃度是芯片的2倍至30倍。

blob.png

基于測序的基因分型技術(shù)依賴DNA庫的隨機(jī)抽樣,而標(biāo)記的數(shù)量與待測序區(qū)域的數(shù)量和大小成正比。當(dāng)待研究群體的限制性位點(diǎn)保守時(shí),基因組區(qū)域預(yù)計(jì)沒有偏差。因此,樣品間的標(biāo)記不保守,并且沒有兩個(gè)樣品能提供相同的一組標(biāo)記。這導(dǎo)致數(shù)據(jù)丟失,并需要

復(fù)雜的信息學(xué)通過推算來恢復(fù)丟失的數(shù)據(jù)。樣品間不保守的標(biāo)記必須通過參考基因組來推算,或利用覆蓋度非常高的測序(18倍或更高)通過相關(guān)品系的單倍型來推算。


選擇測序方法的考慮因素

對(duì)于上面提到的任何應(yīng)用,在決定采用哪種方法之前,必須考慮到影響基因分型的各種因素。

    雜合子檢出錯(cuò)誤:基于測序的基因分型技術(shù),尤其是GBS,依賴低覆蓋度來降低成本,并獲得大量標(biāo)記,這些標(biāo)記可用于關(guān)聯(lián)作圖。這種實(shí)驗(yàn)方法的缺點(diǎn)在于雜合子的檢出明顯過低,這影響了基因型準(zhǔn)確性。GBS檢出不足50%的雜合子。一項(xiàng)關(guān)于DNA測序所需覆蓋度的研究14預(yù)測,對(duì)于每個(gè)雜合二倍體,檢測99.75%位點(diǎn)上的兩個(gè)等位基因至少一次,需要13.5倍的深度。而檢測每個(gè)等位基因至少兩次,將需要18倍的深度。增加測序覆蓋度導(dǎo)致每個(gè)樣品的成本更高,并使得測序比芯片更為昂貴。關(guān)于葡萄的研究表明,以5.7倍的平均深度基因分型時(shí),30-50%的雜合子未檢出。15 而芯片上雜合子的檢出準(zhǔn)確性是由芯片設(shè)計(jì)決定的,這是高度可預(yù)測的,使得基因型檢出準(zhǔn)確性接近100%。芯片所使用的進(jìn)一步設(shè)計(jì)方法能夠?qū)C含量高于60%的基因組區(qū)域進(jìn)行基因分型。

    基因組覆蓋度:任何技術(shù)所帶來的標(biāo)記數(shù)量有望實(shí)現(xiàn)基因組的均一覆蓋?;跍y序的基因分型技術(shù)表現(xiàn)出數(shù)據(jù)丟失,這導(dǎo)致基因組的不均一覆蓋。丟失的數(shù)據(jù)是實(shí)驗(yàn)條件和基因組結(jié)構(gòu)的函數(shù)所造成,源于文庫復(fù)雜度(即獨(dú)特序列標(biāo)簽的數(shù)量)和文庫的序列覆蓋度的組合。丟失數(shù)據(jù)的量與文庫制備的多重水平以及RE消化所使用的酶直接相關(guān)。測序技術(shù)中限制性內(nèi)切酶的選擇影響了等位基因信號(hào)丟失,從而影響群體遺傳學(xué)的統(tǒng)計(jì)數(shù)據(jù)。稀有標(biāo)記需要切割不頻繁的酶,隨后產(chǎn)生較少的標(biāo)記。若使用頻繁切割的酶,會(huì)產(chǎn)生較多的標(biāo)記,但覆蓋度明顯降低,導(dǎo)致大量的數(shù)據(jù)丟失。


所有代表性降低的測序技術(shù)依賴基因組復(fù)雜度降低,從而降低成本并增加通量。復(fù)雜度降低的缺點(diǎn)在于所獲得的基因型數(shù)據(jù)有著明顯的丟失數(shù)據(jù)。16 基因型數(shù)據(jù)可能丟失,因?yàn)榛蚪M結(jié)構(gòu)中的內(nèi)在差異,如存在-缺失差異、多態(tài)性限制位點(diǎn)的變異,以及差異甲基化,這影響代表性降低的測序技術(shù)中所使用的甲基化敏感的酶。丟失的數(shù)據(jù)對(duì)QTL作圖很重要,其中親本系的基因型數(shù)據(jù)質(zhì)量對(duì)作圖群體的基因型檢出至關(guān)重要。親本系需要以非常高的覆蓋度測序。



圖5:說明了序列覆蓋度與丟失數(shù)據(jù)之間的關(guān)系,這項(xiàng)結(jié)果是由近期一篇論文發(fā)表的,它比較了不同平臺(tái)上基于測序的基因分型。17 此研究表明,在10倍覆蓋度下,可獲得1,000個(gè)標(biāo)記,且50%的數(shù)據(jù)丟失,而低覆蓋度下的標(biāo)記數(shù)量增加至30,000個(gè)時(shí),90%的數(shù)據(jù)丟失。

blob.png



基因型數(shù)據(jù)的預(yù)期量和實(shí)際量可能差異巨大。近期一項(xiàng)使用GBS的玉米研究18表明,基因組位置分布的傾斜覆蓋和不成比例的區(qū)域不代表最初預(yù)計(jì)的信息。這限制了測序技術(shù)的范圍和應(yīng)用,被認(rèn)為無法用于關(guān)聯(lián)研究的精細(xì)作圖。大多數(shù)位點(diǎn)的基因型數(shù)據(jù)只能通過大幅增加read深度來實(shí)現(xiàn),而這會(huì)影響測序成本。


丟失的數(shù)據(jù)可利用數(shù)據(jù)推算技術(shù)來恢復(fù),也就是將數(shù)據(jù)與參考基因組比對(duì),這需要大量的投資、先進(jìn)的分析,以及復(fù)雜的流程,能過濾、排序并比對(duì)序列數(shù)據(jù)。缺乏簡單易用且統(tǒng)一的信息學(xué)流程仍然是在常規(guī)應(yīng)用中采用基于測序的基因分型技術(shù)的第二大障礙。推算特別適合親緣關(guān)系相近的個(gè)體,但對(duì)于高度多樣化的樣品,丟失的數(shù)據(jù)可替換為近鄰的等位基因。19 當(dāng)丟失數(shù)據(jù)的比例高時(shí),基于測序的基因分型技術(shù)也會(huì)丟失低頻率的等位基因。替代方案是追求更高深度的測序,這會(huì)導(dǎo)致每個(gè)樣品的成本更高。

LD和多態(tài)性頻率:對(duì)于收集基因型數(shù)據(jù)的群體而言,它的基因組多樣性和交配系統(tǒng)對(duì)測序成本有很大的影響。從一個(gè)較窄的遺傳基礎(chǔ)衍生而來的群體表現(xiàn)出較少的多態(tài)性,需要更多的測序,并增加總成本。四倍體棉花等物種便是如此,其每1,000-1,500個(gè)堿基表現(xiàn)出一個(gè)多態(tài)性。物種內(nèi)的LD衰減也決定了多個(gè)群體的關(guān)聯(lián)作圖所需的標(biāo)記數(shù)量。圖6顯示了LD衰減對(duì)標(biāo)記分辨率的影響。對(duì)LD衰減高的物種而言,標(biāo)記密度的低分辨率將導(dǎo)致基因組的覆蓋度不足。水產(chǎn)養(yǎng)殖物種(如鱒魚)和植物(包括玉米、葡萄和甜菜)表現(xiàn)出低的LD,在關(guān)聯(lián)分析時(shí)需要大量的片段。近期一項(xiàng)關(guān)于鱒魚的全基因組關(guān)聯(lián)研究20使用了基于測序的基因分型技術(shù),并得出結(jié)論,LD的快速衰減需要更高水平的標(biāo)記密度,才能高效地開展全基因組關(guān)聯(lián)研究。

拷貝數(shù)應(yīng)用:基于芯片和測序的基因分型技術(shù)可被用來開展拷貝數(shù)研究,以鑒定復(fù)雜性狀的遺傳變異。這兩種技術(shù)都能檢測拷貝數(shù)獲得。但基于測序的基因分型技術(shù)在低覆蓋度下難以鑒定拷貝數(shù)丟失,因?yàn)槠蝸G失顯示為低覆蓋度的標(biāo)記。21 更高覆蓋度將實(shí)現(xiàn)CNV丟失的檢測,但成本有望增加40-50%。

基因組復(fù)雜度:多倍性是植物和某些動(dòng)物的更復(fù)雜屬性之一。60-70%的被子植物是多倍體,其倍性水平從葡萄籽的四倍體到草莓的八倍體,而甘蔗更為復(fù)雜,其倍性水平從12-16倍不等。多倍體物種表現(xiàn)出基因組復(fù)制。多倍體的挑戰(zhàn)如下:(i) 多倍體物種需要更高的序列覆蓋度,才能高效覆蓋更大的基因組,而這增加了測序成本。(ii) 基因組組裝和作圖算法很復(fù)雜,容易出錯(cuò),特別是在組裝旁系同源/直系同源區(qū)域時(shí)。對(duì)于多倍體且雜合的物種,每個(gè)指定位點(diǎn)的數(shù)據(jù)推算都需要復(fù)雜的分析流程,而這不能用于常規(guī)的育種應(yīng)用。22 此外,更深度的測序增加了總成本。測定基因組中每個(gè)位點(diǎn)的等位基因劑量信息對(duì)基因組選擇模式很重要。在使用芯片對(duì)多倍體物種進(jìn)行基因分型時(shí),來自亞基因組的信號(hào)導(dǎo)致聚類壓縮。多倍體物種也表現(xiàn)出不同水平的倍性,因?yàn)楦蓴_突變導(dǎo)致復(fù)雜度降低。常規(guī)的育種應(yīng)用必須有一個(gè)分析流程,能自動(dòng)聚類并分配基因型,以滿足嚴(yán)格的育種時(shí)限要求。Axiom? GT1算法用貝葉斯統(tǒng)計(jì)來準(zhǔn)確分配基因型并讓多倍體基因組的數(shù)據(jù)聚類。圖7顯示了一個(gè)例子。自動(dòng)流程讓人們能夠輕松準(zhǔn)確地對(duì)數(shù)千個(gè)樣品的數(shù)千個(gè)標(biāo)記進(jìn)行基因分型。

為您的基因分型項(xiàng)目選擇適當(dāng)方案的指南:鑒于芯片技術(shù)和測序技術(shù)的進(jìn)步,科學(xué)家們需要認(rèn)識(shí)到使用測序技術(shù)的挑戰(zhàn),以及使用測序和芯片技術(shù)的偏向。下列問題可幫助您選擇適當(dāng)?shù)募夹g(shù),應(yīng)用在科研或基因組育種項(xiàng)目所考慮的物種上:

n 獲取基因型數(shù)據(jù)所使用的分析是否與所考慮物種的基因組結(jié)構(gòu)兼容,它是否能帶來足夠量的可靠標(biāo)記?

n 是否有需要靶定特定染色體區(qū)域,需要采用何種標(biāo)記策略以覆蓋整個(gè)基因組?

n 所考慮物種的潛在LD結(jié)構(gòu)如何?

n 此物種是不是多倍體,倍性水平如何?

n 將此技術(shù)引入科研或育種項(xiàng)目需要哪種信息學(xué)流程和專業(yè)知識(shí)?

n 需要多少個(gè)小時(shí)才能檢出基因型并聚類數(shù)據(jù)?

n 所考慮的群體是近交群體,還是多樣化的無關(guān)個(gè)體,預(yù)計(jì)雜合水平如何?

n 需要對(duì)多少個(gè)樣品進(jìn)行基因分型,周轉(zhuǎn)時(shí)間或出結(jié)果的時(shí)間是否有限制?

n 需要何種深度的序列覆蓋,才能準(zhǔn)確檢出基因型?

n 數(shù)據(jù)缺口有什么影響,您將如何恢復(fù)丟失的基因型?

n 考慮到丟失數(shù)據(jù)和生物信息學(xué)流程和分析所需的資源,分析的成本如何?

n 技術(shù)的通量、周轉(zhuǎn)時(shí)間、分析的可靠性以及技術(shù)所使用的儀器如何?

n 育種項(xiàng)目可接受的偏差量如何,是否有辦法繞過偏差?

n 需要將多少種不同的技術(shù)或分析整合到科研或育種項(xiàng)目中,進(jìn)行有效驗(yàn)證、標(biāo)記性狀或常規(guī)使用?


芯片技術(shù)不斷發(fā)展,形成Axiom? 384HT的格式。這個(gè)能以非常經(jīng)濟(jì)的價(jià)格點(diǎn)同時(shí)處理384個(gè)樣品的創(chuàng)新讓此技術(shù)從科研走向主流的商業(yè)化農(nóng)業(yè)基因組學(xué)。在優(yōu)先考慮周轉(zhuǎn)時(shí)間、易用性和數(shù)據(jù)質(zhì)量的應(yīng)用中,芯片仍然是理想技術(shù)。

基于芯片的技術(shù)在單一平臺(tái)上合并了多個(gè)基因分型應(yīng)用,提供了靈活性和經(jīng)濟(jì)性。分析和信息學(xué)分析流程的創(chuàng)新讓所有感興趣的相關(guān)標(biāo)記能夠不受限制地基因分型,其結(jié)果可通過簡單的流程在幾小時(shí)內(nèi)得到。Axiom?基因分型解決方案,來自Affymetrix的芯片

技術(shù)演化,為全基因組分析到常規(guī)篩查的應(yīng)用提供了完整的解決方案,具有高準(zhǔn)確性和重復(fù)性、簡化的流程和低成本 。

blob.png


基于測序的基因分型技術(shù)的挑戰(zhàn)總結(jié)在表2。

表2:表2比較了基于測序的基因分型技術(shù)(如RADseq和GBS)與Axiom? Genotyping Arrays的特點(diǎn)。新技術(shù)由于忽視了實(shí)際實(shí)驗(yàn)條件和基因組復(fù)雜度而呈現(xiàn)的較低成本, 卻往往被宣傳為替代芯片技術(shù)的理由。


blob.png

Affymetrix的農(nóng)業(yè)基因組學(xué)基因分型方案為育種人員和研究人員提供了一種強(qiáng)大而經(jīng)濟(jì)的工具,可鑒定、驗(yàn)證和篩查植物或動(dòng)物中復(fù)雜的遺傳性狀,實(shí)現(xiàn)更快速、更精確的育種。Axiom?基因分型一開始是從SNP文庫資源中選擇標(biāo)記內(nèi)容,接著設(shè)計(jì)SNP芯片,最后用芯片來鑒定樣品的基因型。這為育種人員和研究人員提供了一種功能性的基因分型工具,讓其應(yīng)用在標(biāo)記-性狀關(guān)聯(lián)、全基因組關(guān)聯(lián)研究(GWAS)、數(shù)量性狀位點(diǎn)(QTL)分析和基因組選擇項(xiàng)目中。


鑒于genotyping-by-sequencing技術(shù)在數(shù)據(jù)管理、計(jì)算需求上的挑戰(zhàn),且定制信息學(xué)流程需要根據(jù)每個(gè)物種和樣品群體來定制,芯片在數(shù)據(jù)質(zhì)量、完整性、分析和常規(guī)育種的應(yīng)用上是很簡單的技術(shù)。


總的來說,適用于動(dòng)物和植物基因分型的Axiom?基因分型解決方案讓人們能夠?yàn)榫哂猩虡I(yè)價(jià)值的物種定制芯片上的基因分型內(nèi)容。Axiom基因分型解決方案包括物種特異和定制的芯片,其經(jīng)過驗(yàn)證的基因組內(nèi)容來自Axiom?基因組數(shù)據(jù)庫,以及完整的試劑盒、數(shù)據(jù)分析工具,和一個(gè)利用GeneTitan?多通道(MC)儀器的全自動(dòng)流程。


References and publications

1 Baird N. A., et al. Rapid SNP discovery and genetic mapping using sequenced RAD markers. PLoS ONE 3:e3376 (2008). doi:10.1371/journal.pone.0003376

2 Elshire R. J., et al. A robust, simple genotyping-by-sequencing (GBS) approach for high diversity species. PLoS ONE 6:e19379 (2011). doi:10.1371/journal.pone.0019379

3 Narum S. R., et al. Genotyping-by-sequencing in ecological and conservation genomics. Molecular Ecology 22: 2841?2847 (2013). doi:10.1111/mec.12350

4 Peterson B. K., et al. Double digest RADseq: an inexpensive method for de novo SNP discovery and genotyping in model and non-model species. PLoS ONE 7(5):e37135 (2012).

doi:10.1371/journal.pone.0037135

5 Kranis A., et al. Development of a high density 600K SNP genotyping array for chicken. BMC Genomics 14:59 (2013). doi:10.1186/1471-2164-14-59

6 Houston R. D., et al. Development and validation of a high density SNP genotyping array for Atlantic salmon (Salmo salar). BMC Genomics 15:90 (2014). doi:10.1186/1471-

2164-15-90

7 Affymetrix application note Mitigating sequencing errors, monomorphs, and poor performing markers during de novo SNP selection for genotyping applications (2013) P/N

DNA02261 Rev. 1

8 Ersoz E. S., Yu J., Buckler E. S. Applications of linkage disequilibrium and association mapping in crop plants, in Genomics-Assisted Crop Improvement: vol 1: Genomics

Approaches and Platforms, eds. Varshney R. K., Tuberosa R. Springer, pp. 97-119 (2007). doi:10.1007/978-1-4020-6295-7_5

9 Poland J. A., et al. Genotyping-by-sequencing for plant breeding and genetics. The Plant Genome 5(3):92?102 (2012). doi:10.3835/plantgenome2012.05.0005

10 Meuwissen T., et al. Accelerating improvement of livestock with genomic selection. Annual Review of Animal Biosciences 1:221-237 (2013). doi:10.1146/annurevanimal-

031412?103705

11 Hui L., et al. An evaluation of genotyping by sequencing (GBS) to map the Breviaristatum-e (ari-e) locus in cultivated barley. BMC Genomics 15:104 (2014). doi:10.1186/1471-

2164-15-104

12 Liu S., et al. Development of the catfish 250K SNP array for genome-wide association studies. BMC Research Notes 7:135 (2014). doi:10.1186/1756-0500-7-135

13 Cavangh C. R., et al. Genome-wide comparative diversity uncovers multiple targets of selection for improvement in hexaploid wheat landraces and cultivars. 110(20):8057–8062.

doi:10.1073/pnas.1217133110

14 Wendl M. C., et al. Aspects of coverage in medical DNA sequencing. BMC Bioinformatics 9:239 (2008). doi: 10.1186/1471-2105-9-239

15 Hyma K. E., GBS Usage Cases: Non-model Organisms. (2013). http://cbsu.tc.cornell.edu/lab/doc/GBS_nonmodel_Sept_2013.pdf

16 Davey J. W., et al. Genome-wide genetic marker discovery and genotyping using next-generation sequencing. Nature Reviews Genetics 12(7):499–510 (2011). doi:10.1038/

nrg3012

17 Mascher M., et al. Application of genotyping-by-sequencing on semiconductor sequencing platforms: a comparison of genetic and reference-based marker ordering in barley.

PLoS ONE 8(10):e76925 (2013). doi:10.1371/journal.pone.0076925

18 Beissinger T. M., et al. Marker density and read depth for genotyping populations using genotyping-by-sequencing. Genetics 193(4):1073–1081 (2013). doi:10.1534/

genetics.112.147710

19 Huang X., et al. Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics 42(11):961?967 (2010). doi:10.1038/ng.695

20 Rexroad C. E., et al. Estimates of linkage disequilibrium and effective population size in rainbow trout. BMC Genetics 10:83 (2009). doi:10.1186/1471-2156-10-83

21 Donato MD et. al. Genotyping-by-sequencing (GBS): a novel, efficient and cost-effective genotyping method for cattle using next- generation sequencing. PLoS ONE 8(5):

e62137. doi:10.1371/journal.pone.0062137.

22 Brummer, et al. Applied genetics and genomics in alfalfa breeding. Agronomy 2:40-61 (2012). doi:10.3390/agronomy2010040


來自Affymetrix的農(nóng)業(yè)基因組學(xué)解決方案為育種者和研究人員提供了一系列強(qiáng)大而靈活的基因分型工具,

可經(jīng)濟(jì)高效地鑒定、驗(yàn)證并篩查植物和動(dòng)物中的復(fù)雜遺傳性狀。

來自Affymetrix的農(nóng)業(yè)基因組學(xué)解決方案為育種者和研究人員提供了一系列強(qiáng)大而靈活的基因分型工具,

可經(jīng)濟(jì)高效地鑒定、驗(yàn)證并篩查植物和動(dòng)物中的復(fù)雜遺傳性狀。

來自Affymetrix的農(nóng)業(yè)基因組學(xué)解決方

收 藏