yy玄幻小说排行榜完本,完美世界txt全集下载

農(nóng)業(yè)基因組學(xué)解決方案

適合您所有研究階段的平臺(tái)

來自Affymetrix的農(nóng)業(yè)基因組學(xué)解決方案為育種者和研究人員提供了一系列強(qiáng)大而靈活的基因分型工具，可經(jīng)濟(jì)高效地鑒定、驗(yàn)證并篩查植物和動(dòng)物中的復(fù)雜遺傳性狀。

Affymetrix的遺傳分析工具讓您有能力：

發(fā)現(xiàn)

■ 通過遺傳分析技術(shù)確定de novo遺傳多樣性

■ 分析群體結(jié)構(gòu)

關(guān)聯(lián)

■ 鑒定與理想性狀相關(guān)的遺傳標(biāo)記

■ 確認(rèn)標(biāo)記-性狀關(guān)聯(lián)

■ 了解對(duì)環(huán)境的遺傳適應(yīng)性

管理

■ 利用遺傳信息來選取期望的結(jié)果

■ 篩查植物和動(dòng)物的理想性狀

基于芯片的基因分型的優(yōu)點(diǎn)：

經(jīng)濟(jì)

■ 經(jīng)濟(jì)高效的基因分型工具

簡單

■ 在單個(gè)技術(shù)平臺(tái)上結(jié)合多個(gè)基因分型應(yīng)用

■ 輕松且簡單的流程

■ 幾小時(shí)內(nèi)即可獲得準(zhǔn)確的結(jié)果

靈活

■ 高通量的基因分型工具適合高密度或靶向基因分型應(yīng)用

■ 能基因分型所有您感興趣的相關(guān)的標(biāo)記

■ 低樣品量需求

來自Affymetrix的基于芯片的基因分型產(chǎn)品為從全基因組分析到常規(guī)篩查的各種應(yīng)用提供了完整的解決方案，且準(zhǔn)確性和重復(fù)性高、流程簡單、成本低。

Axiom?基因分型解決方案為您提供多種芯片。您可以選擇要研究物種的自定義內(nèi)容，也可以選擇來自Axiom?基因組數(shù)據(jù)庫的基因型經(jīng)過驗(yàn)證的內(nèi)容。

強(qiáng)大

■ 對(duì)任何物種、任何基因組規(guī)模和任何倍性水平進(jìn)行基因分型

■ Axiom?分析可檢測插入或缺失(indel)并保證包含所有候選SNP，與相鄰SNP最近可達(dá)10 bp，實(shí)現(xiàn)了更高效的QTL分析

可靠

■ 低至100 ngDNA，即可獲得基因分型結(jié)果，適用于各種樣本類型

■ 基因型檢出率≥99%

擴(kuò)展

■ 完全自動(dòng)化的流程，每周可處理最多8張芯片板，而無需增加人工或儀器

■ 一張芯片板上有96個(gè)或384個(gè)樣本

■ 檢測每個(gè)樣品多達(dá)260萬個(gè)變異

植物基因分型解決方案

自動(dòng)化檢出多倍體和二倍體基因型，無須手動(dòng)操作

Affymetrix與學(xué)術(shù)研究機(jī)構(gòu)和商業(yè)種子公司的科學(xué)家們合作，為多種植物設(shè)計(jì)芯片，包括水稻、小麥、玉米、土豆、西紅柿、棉花、大豆、草莓、及景觀植物。這些芯片讓研究人員能夠鑒定出與理想的表型性狀相關(guān)的基因。

■ Affymetrix已開發(fā)出先進(jìn)的基因型算法和軟件工具，能對(duì)非二倍體復(fù)雜基因組自動(dòng)分析

■ 該算法提供了可調(diào)的參數(shù)，可對(duì)近交系群體及基因組偏離參考序列的樣品進(jìn)行準(zhǔn)確分型

Axiom?玉米基因分型芯片

■ 目前唯一一款高密度覆蓋玉米SNP位點(diǎn)的基因分型芯片，包含609,442個(gè)SNP和6,759個(gè)插入/缺失。

■ 這些標(biāo)記在288個(gè)世界主要的不同品系玉米樣本上進(jìn)行包含120萬個(gè)SNP位點(diǎn)的Axiom? myDesign? GenotypingArray的篩選獲得。

■ AffymetrixSNPolisher? Analysis對(duì)SNP進(jìn)行準(zhǔn)確的分型。

Axiom?小麥基因分型芯片

■ 高覆蓋度的小麥基因分型芯片。采用96芯片板模式，與布里斯托大學(xué)合作，為全球小麥品系所設(shè)計(jì)，包含817,000個(gè)SNP位點(diǎn)，覆蓋整個(gè)小麥基因組，大大加速現(xiàn)代小麥分子育種進(jìn)程。

■ 經(jīng)育種研究人員精心挑選，在優(yōu)良小麥品系六倍體中表現(xiàn)多態(tài)性，包括了國際小麥測序協(xié)會(huì)(IWGSC)所確定的片段重疊群的SNP標(biāo)記，共35,143個(gè)標(biāo)記，分布于A、B和D基因組中。

Axiom?棉花基因分型芯片

棉花基因分型芯片總共包含35,550個(gè)標(biāo)記

■ 28,158個(gè)利用陸地棉(G. hirsutum)的基因富集序列區(qū)域鑒定出的種內(nèi)特異性標(biāo)記。

■ 7,392個(gè)利用基因組簡化方法發(fā)現(xiàn)的標(biāo)記，基于限制性酶切位點(diǎn)的保守性(GR-RSC)。

■ 5,286個(gè)在陸地棉(G. hirsutum)和海島棉(G. barbadense)種間組裝過程中發(fā)現(xiàn)的標(biāo)記。

■ 2,016個(gè)陸地棉(G. hirsutum)種內(nèi)特異性標(biāo)記。

■ 芯片上可以添加380,000個(gè)定制標(biāo)記，或以100%的保真度向Axiom? 384HT myDesign?育種者芯片上轉(zhuǎn)移多態(tài)性標(biāo)記，以應(yīng)

對(duì)不同群體的樣本研究和分析的需要。

Axiom?大豆基因分型芯片

總共180,961個(gè)標(biāo)記選自20條大豆染色體，代表野生種和栽培種

■ 114,735個(gè)SNP或63.4%的標(biāo)記位于40,631個(gè)基因中。

■ 22,952個(gè)SNP位于基因上游或下游5kb的13,259個(gè)區(qū)域內(nèi)。

■ 43,274個(gè)SNP位于基因間區(qū)域。

■ SNP的發(fā)現(xiàn)和驗(yàn)證是利用韓國16個(gè)大豆品種和中國31個(gè)大豆品種的組合來完成的。

■ 此芯片經(jīng)過228個(gè)品系組合的評(píng)估，這些品系包括高深度的重測序品系、不同來源的重復(fù)DNA樣本、重復(fù)DNA樣本、不同的栽培和野生品系，以及多個(gè)F2代和重組自交系。

Axiom?草莓基因分型芯片

芯片對(duì)栽培種雜交草莓(Fragaria x ananassa)全基因組進(jìn)行覆蓋

■ 95,062個(gè)來自八倍體和二倍體品種的SNP和插入缺失，包括：1,761個(gè)復(fù)等位基因SNP和3,751個(gè)來自二倍體品種的SNP。

■ 代表多個(gè)草莓品種，多樣化的全球育種種質(zhì)資源集促進(jìn)了SNP的開發(fā)。

■ SNP的發(fā)現(xiàn)，通過超過20倍覆蓋度對(duì)9個(gè)八倍體品種進(jìn)行測序分析，包括Holiday、Korona以及Holiday與Korona雜交的F1幼苗；兩個(gè)可能的二倍體祖先，F(xiàn)ragariamandschurica和F. iinumae；一個(gè)已知的二倍體品種，F(xiàn). vesca測序數(shù)據(jù)與F. vesca基因組序列進(jìn)行比對(duì)。

Axiom?玫瑰基因分型芯片

■ Axiom?玫瑰基因分型芯片(WagRhSNP Axiom Array)是通過Affymetrix?專家設(shè)計(jì)項(xiàng)目與荷蘭瓦格寧根大學(xué)植物育種組和德

國萊布尼茨大學(xué)植物遺傳學(xué)研究所合作設(shè)計(jì)的。

■ 總共68,893個(gè)SNP，它們精選自四倍體鮮切花玫瑰和花園玫瑰品種。

■ 應(yīng)對(duì)玫瑰的復(fù)雜性狀研究：多倍體連鎖圖譜，SNP單倍型鑒定，重要表型性狀相關(guān)聯(lián)的QTL分析。

■ 672個(gè)樣本利用Axiom 玫瑰基因分型芯片進(jìn)行了基因分型驗(yàn)證，包括：四倍體鮮切花玫瑰群體K5，四倍體花園玫瑰，倍性水平從二倍體(2x)到五倍體(5x)的13個(gè)品種。

Axiom? myDesign? 基因分型定制芯片

靈活、經(jīng)濟(jì)高效的基因分型定制芯片

Affymetrix為研究人員個(gè)人或協(xié)作組提供經(jīng)濟(jì)的基因分型定制芯片。與我們的生物信息學(xué)團(tuán)隊(duì)合作，為多個(gè)應(yīng)用(從發(fā)現(xiàn)到查)設(shè)計(jì)帶有相關(guān)內(nèi)容的芯片。

每批一致的SNP內(nèi)容和快速的周轉(zhuǎn)時(shí)間

■ 每一筆訂單獲得100%相同的SNP內(nèi)容，只要您的研究需要

■ 無SNP丟失-每次芯片上的內(nèi)容都一致靈活的定制格式

靈活的定制格式

■ 可在同一張芯片上包含多個(gè)物種的標(biāo)記

■ 每張芯片上可設(shè)計(jì)1,500-675,000個(gè)SNP的多重分析，性價(jià)比高，讓您獲得更多信息可擴(kuò)展性

可擴(kuò)展性

■ 480個(gè)樣品的低起定量可滿足您的預(yù)算

■ 再次訂購低至192個(gè)樣品的定制芯片，以完成您的研究

軟件自動(dòng)檢出多倍體及二倍體基因型

通過專業(yè)的生物信息學(xué)支持和簡化的軟件，大大加速您的分析流程

強(qiáng)大的信息學(xué)支持

■ Axiom?軟件利用統(tǒng)計(jì)學(xué)聚類預(yù)測工具FitAllo及AxiomGT1算法，能準(zhǔn)確并靈活地將基因型區(qū)分聚類，并

檢出多倍體及二倍體的基因型

與您現(xiàn)有的系統(tǒng)整合

■ 自動(dòng)化程度高的選項(xiàng)：基于命令行的Affymetrix? PowerTools(APT)

■ 無縫整合第三方軟件包

■ 與32位和64位的Windows? 7和Windows Server 2008操作系統(tǒng)兼容

簡化的數(shù)據(jù)分析

■ 包括靈活的SNP過濾和輸出工具，可輸出成PLINK格式

■ 可視化工具包括散點(diǎn)圖、曲線圖和熱圖

■ SNPolisher軟件包能將SNP自動(dòng)分類，方便您對(duì)基因型質(zhì)控(如下圖所示)

農(nóng)業(yè)基因組學(xué)項(xiàng)目合適的平臺(tái)選擇

不犧牲數(shù)據(jù)質(zhì)量和周轉(zhuǎn)時(shí)間

新一代測序的快速發(fā)展幫助農(nóng)業(yè)科學(xué)家建立起基因組的廣泛資源，這將打造成一個(gè)“基因組文庫的生動(dòng)世界”?？蒲袑W(xué)者、動(dòng)物育種專家和商業(yè)種子公司都開始涉足這個(gè)龐大的基因組文庫資源，從而加強(qiáng)農(nóng)業(yè)基因組學(xué)策略。通過應(yīng)用基因組標(biāo)記來鑒定和選

擇重要性狀，他們的目標(biāo)是提高生產(chǎn)力和商業(yè)可行性。本技術(shù)指南整合了同行評(píng)議的雜志中介紹的基于序列的基因分型方法的經(jīng)驗(yàn)，并比較了芯片在農(nóng)業(yè)基因分型應(yīng)用中的表現(xiàn)，以便協(xié)助您作出基因分型技術(shù)的決策。

基于序列的基因分型概述

基因組選擇和關(guān)聯(lián)作圖或連鎖不平衡(LD)定位技術(shù)需要大量的標(biāo)記，才能準(zhǔn)確估計(jì)與基因型相關(guān)聯(lián)的性狀。這就要求獲得基因型信息所使用的技術(shù)必須是經(jīng)濟(jì)高效，且高通量的。全基因組測序以及利用序列捕獲的靶向基因分型比較昂貴，而產(chǎn)生基因型數(shù)據(jù)的低通量方法對(duì)于常規(guī)應(yīng)用而言仍然是不實(shí)際的。在確定經(jīng)濟(jì)型測序的目標(biāo)下，基于測序的基因分型方法，如基于酶切的簡化DNA測序1 (RADseq)和genotyping-by-sequencing (GBS) 2已不斷發(fā)展，它們?cè)诳蒲泻腿粘?yīng)用中的潛力被不斷引用。

基于測序的方法依賴于對(duì)多個(gè)樣品添加條形碼，并降低基因分型的成本。這種技術(shù)利用限制性內(nèi)切酶來消化目標(biāo)限制位點(diǎn)和低拷貝基因組區(qū)域，以降低基因組復(fù)雜度。這樣就能夠避免帶有重復(fù)序列的區(qū)域，它們?nèi)菀桩a(chǎn)生模糊或假的SNP，且增加測序成本。利用測序而獲得的基因型數(shù)據(jù)在質(zhì)量和數(shù)量上大有不同，這高度依賴于生物體的基因組大小和結(jié)構(gòu)以及評(píng)估的群體?；蚪M結(jié)構(gòu)的復(fù)雜度，如倍性水平、GC含量和重復(fù)序列、待研究群體的遺傳多樣性，以及群體內(nèi)的交配系統(tǒng)，都對(duì)測序技術(shù)準(zhǔn)確輕松收集基因型數(shù)據(jù)的成本、準(zhǔn)確性和效率有著直接的影響。對(duì)于那些標(biāo)記探索落后或不完善的物種而言，基于測序的基因分型技術(shù)很有用。GBS和RADseq都能用于至少96個(gè)樣品，而不需要訪問參考數(shù)據(jù)庫或之前發(fā)現(xiàn)的標(biāo)記。這種技術(shù)還特別適合篩查數(shù)千個(gè)多態(tài)性，以了解遺傳變異的后果，之前人們依賴極其少量的標(biāo)記，如微衛(wèi)星和擴(kuò)增片段長度多態(tài)性(AFLP)。基于測序的基因分型技術(shù)已被用于標(biāo)記的發(fā)現(xiàn)。雜志上已經(jīng)發(fā)表了在多個(gè)物種上開展的各種實(shí)驗(yàn)的結(jié)果，如大麥、玉米、小麥、牛和鱒魚等。在常規(guī)的基因分型中使用基于測序的基因分型技術(shù)依然遙遙無期，這有幾方面的原因，本文中也列出了其中一些。《Molecular Ecology》雜志關(guān)于genotyping-by-sequencing技術(shù)的特刊3也總結(jié)指出，新的genotyping-by-sequencing技術(shù)仍然是不完善的，無法在不同的植物和動(dòng)物中充分地?cái)U(kuò)展。

基于序列的基因分型中的關(guān)鍵實(shí)驗(yàn)因素

所有的新一代測序平臺(tái)都有序列堿基數(shù)量的限制，它們由每個(gè)測序運(yùn)行產(chǎn)出。這個(gè)有限的產(chǎn)出能力意味著基于測序的基因分型運(yùn)行必須平衡四個(gè)關(guān)鍵參數(shù)：樣品多重分析的水平、基因組覆蓋度、序列覆蓋度以及每個(gè)樣品的成本。樣品的多重分析很關(guān)鍵，因?yàn)闇y序儀的有限產(chǎn)出能力必須由運(yùn)行中包括的所有樣品來共享。更多樣品意味著每個(gè)樣品的測序堿基更少。

基因組覆蓋度也很重要，因?yàn)樗鼪Q定了被分析基因組的百分比，因此，也決定了基因組中可獲取的標(biāo)記數(shù)量。更高的基因組覆蓋度是以犧牲其他參數(shù)中的一個(gè)為代價(jià)而實(shí)現(xiàn)的，因?yàn)樗枰嗟臏y序儀產(chǎn)出能力。

序列覆蓋度(或序列“深度”)決定了數(shù)據(jù)集中每個(gè)序列的平均讀取數(shù)量。實(shí)際上，一些序列頻繁被讀取，而一些較少被讀取，或根本沒有。序列覆蓋度影響數(shù)據(jù)中缺口的百分比以及基因型準(zhǔn)確性。準(zhǔn)確的基因型檢出通常需要每個(gè)SNP上30倍或更高的覆蓋度。增加序列覆蓋度也迫使在其他地方妥協(xié)，以平衡測序儀能力的使用。當(dāng)然，樣品多重分析、基因組覆蓋度和序列覆蓋度都能通過在測序儀上投入更多運(yùn)行來改善，但這會(huì)使成本迅速增加。本技術(shù)指南討論了每種新型測序技術(shù)中實(shí)驗(yàn)方法的影響、基因組復(fù)雜度對(duì)標(biāo)記數(shù)量的影響，以及應(yīng)用范圍。實(shí)驗(yàn)方法的變化可明顯增加任何基因分型項(xiàng)目的成本，對(duì)于30,000個(gè)標(biāo)記的項(xiàng)目，可能增加五倍。

應(yīng)用

基因組覆蓋度高度依賴于基因分型技術(shù)和方法的選擇，而這個(gè)選擇取決于感興趣的應(yīng)用。每種方法提供了不同水平的植物或動(dòng)物基因組覆蓋度。這影響了可獲取的標(biāo)記數(shù)量，也決定了哪種方法適合目標(biāo)應(yīng)用。這些應(yīng)用的范圍從群體基因組掃描到確定系統(tǒng)發(fā)育。圖2顯示了不同的基于測序和芯片的基因分型方法如何定位到各種應(yīng)用，以及與覆蓋基因組相關(guān)的相對(duì)成本。每種基于測序的方法所覆蓋的標(biāo)記數(shù)量取決于實(shí)驗(yàn)參數(shù)，如限制性內(nèi)切酶的類型、DNA的質(zhì)量和數(shù)量以及分析技術(shù)。每個(gè)應(yīng)用的標(biāo)記數(shù)量如圖2所示，是被測序的基因組部分的函數(shù)。準(zhǔn)確基因分型所需的標(biāo)記數(shù)量是基因組水平的連鎖不平衡的數(shù)量、系譜中捕獲的重組事件、各組之間分歧的函數(shù)。4通過改變分析中的限制性內(nèi)切酶，以增加標(biāo)簽數(shù)量，可提高基因組覆蓋度。然而，正如上文指出的，提高基因組覆蓋度是以更低的樣品多重分析、更低的序列覆蓋度或每個(gè)樣品的更高成本為代價(jià)的。

群體基因組掃描和測序驗(yàn)證：芯片和基于測序的基因分型技術(shù)已經(jīng)用于開展群體掃描和驗(yàn)證那些利用新一代測序發(fā)現(xiàn)的標(biāo)記?；跍y序的基因分型策略容易檢出假的SNP，因?yàn)闇y序技術(shù)存在固有誤差，拷貝數(shù)變異無法定位到參考基因組，或來自旁系同源或同源基因。通過更深度的序列覆蓋，假的SNP可排除，但這會(huì)增加每個(gè)樣品的成本，通過使用雙單倍體或高質(zhì)量的參考序列，也可避免這一問題，但這些會(huì)導(dǎo)致更復(fù)雜的信息學(xué)分析，而嚴(yán)格的過濾條件會(huì)丟棄大部分的測序數(shù)據(jù)。通過運(yùn)行群體內(nèi)的大量樣品來驗(yàn)證標(biāo)記，可鑒定出信息量大且重復(fù)的標(biāo)記。高密度的Axiom?芯片已成功應(yīng)用于驗(yàn)證測序發(fā)現(xiàn)和排除假的SNP，這些SNP是許多物種測序錯(cuò)誤的結(jié)果，包括雞5和三文魚6。芯片帶來了一種簡單的方法，可以評(píng)估不同群體中的數(shù)百萬個(gè)標(biāo)記，并驗(yàn)證那些通過不同測序技術(shù)(如RADseq、RNAseq和重測序)發(fā)現(xiàn)的標(biāo)記。

關(guān)聯(lián)作圖、基因組選擇和拷貝數(shù)應(yīng)用：關(guān)聯(lián)作圖(AM)技術(shù)使用大量的多態(tài)性標(biāo)記來克服QTL定位中的挑戰(zhàn)和限制。關(guān)聯(lián)作圖依賴連鎖不平衡和現(xiàn)有基因庫中存在的重組，來開展隨機(jī)交配群體、各系或種質(zhì)間的表型-基因型關(guān)聯(lián)。8 在關(guān)聯(lián)作圖研究中，更多的標(biāo)記增加了找到或定位致病變異的可能性，9 因此標(biāo)記越多越好。盡管關(guān)聯(lián)作圖可通過基于測序的基因分型方法來完成，但芯片通常能更經(jīng)濟(jì)高效地對(duì)高密度的標(biāo)記進(jìn)行基因分型，且有著更好的數(shù)據(jù)質(zhì)量和完整性。

密集的標(biāo)記也可用在基因組選擇中，其中在基因分型和表型檢測中同時(shí)估計(jì)標(biāo)記的影響，或訓(xùn)練群體，然后用來預(yù)測選擇候選物的價(jià)值?；蚪M選擇的準(zhǔn)確性隨標(biāo)記密度的增加而增加。據(jù)估計(jì)，50,000個(gè)標(biāo)記已足以準(zhǔn)確預(yù)測這些關(guān)系。10 拷貝數(shù)變異檢測實(shí)現(xiàn)了復(fù)雜性狀中可遺傳變異的研究和鑒定。

系譜和數(shù)量性狀位點(diǎn)(QTL)作圖：與關(guān)聯(lián)作圖不同，QTL作圖查看多個(gè)基因?qū)?shù)量性狀的影響，如三文魚控制對(duì)海虱的抗性或魚卵大小的QTL。QTL鑒定是基于雙親雜交，需要通過精細(xì)作圖鑒定染色體區(qū)域的單個(gè)基因，因此需要大量的雜交來產(chǎn)生足夠數(shù)量的減數(shù)分裂事件。系譜基因分型利用QTL檢測中的育種材料，它們覆蓋多代，通過多次雜交與系譜中的共同祖先相關(guān)聯(lián)。這實(shí)現(xiàn)了育種項(xiàng)目中存在的大部分等位基因的鑒定和使用。

系統(tǒng)發(fā)育和群體定位：在各個(gè)研究機(jī)構(gòu)維護(hù)的種質(zhì)和育種者維護(hù)的種質(zhì)中，群體結(jié)構(gòu)可能有所不同。不同的群體結(jié)構(gòu)需要不同的全基因組關(guān)聯(lián)研究(GWAS)方法。通過構(gòu)建遺傳或連鎖圖譜來調(diào)查群體結(jié)構(gòu)和開展系統(tǒng)發(fā)育分析，可提供基因組重組率的信息。了解群體結(jié)構(gòu)也有助于選擇適當(dāng)?shù)臉?biāo)記和密度。通過研究很小一部分基因組中的標(biāo)記，可完成群體分析。

工作流程：基于芯片的技術(shù)和基于測序的基因分型技術(shù)的工作流程比較如圖3所示。基于測序的基因分型技術(shù)依賴條形碼技術(shù)對(duì)樣品進(jìn)行多重分析(例如，96個(gè)樣品在單個(gè)通道中測序?qū)⑿枰?6個(gè)樣品條形碼)。文庫制備需要選擇適合該物種和所需標(biāo)記數(shù)量的限制性內(nèi)切酶。此過程需要優(yōu)化，以避免引物二聚體等問題，這些可能增加測序的費(fèi)用。在文庫制備之后，真正的測序約需11個(gè)小時(shí)至11天不等，這取決于儀器的能力和測序基因組的百分比。更高的樣品多重分析也并非不可能，但正如之前提到的，必須平衡基因組大小，測序基因組的百分比以及單個(gè)通道中的序列覆蓋度。測序之后，數(shù)據(jù)經(jīng)過過濾，條形碼被解復(fù)用，以提取每個(gè)樣品的標(biāo)記。使用任一基因分型技術(shù)的重要考慮因素是計(jì)算設(shè)備和分析流程。分析流程需要根據(jù)感興趣的物種、實(shí)驗(yàn)方法、待研究的群體和技術(shù)本身來定制。

James Hutton研究所近期發(fā)表的一篇文章11得出結(jié)論，利用GBS來研究大麥的一個(gè)重要結(jié)果是，與目前實(shí)驗(yàn)室中使用的多重SNP分析技術(shù)相比，GBS數(shù)據(jù)在處理和隨后的分析上更具挑戰(zhàn)性。采用基于測序的基因分型技術(shù)存在諸多挑戰(zhàn)，包括計(jì)算設(shè)備，維護(hù)定制分析流程的生物信息學(xué)專家，開展比對(duì)和分析的軟件，以及提取有用的基因分型數(shù)據(jù)所需的時(shí)間。測序技術(shù)的數(shù)據(jù)分析通常在“云端”開展，以盡量減少本地?cái)?shù)據(jù)存儲(chǔ)和計(jì)算要求。變異檢出往往通過定制的軟件來開展，這些軟件檢出各種基因型。每個(gè)存儲(chǔ)技術(shù)都具有與數(shù)據(jù)轉(zhuǎn)移、存儲(chǔ)和檢索相關(guān)的成本，這會(huì)影響基因分型項(xiàng)目的成本。

相比之下，基于芯片的基因分型技術(shù)能輕松地利用臺(tái)式工作站，對(duì)每個(gè)樣品的數(shù)百萬個(gè)數(shù)據(jù)點(diǎn)進(jìn)行基因分型，在降低設(shè)備費(fèi)用的同時(shí)提高操作效率。這種芯片法基因分型的簡約、易用讓芯片可在各種場景和環(huán)境下使用，對(duì)常規(guī)育種應(yīng)用而言尤其有吸引力，因?yàn)榇罅繕悠诽幚砗椭苻D(zhuǎn)時(shí)間都很重要。

文庫制備中的DNA質(zhì)量和數(shù)量：基于測序的基因分型技術(shù)對(duì)DNA濃度和DNA質(zhì)量的要求仍然是實(shí)際應(yīng)用中的嚴(yán)重挑戰(zhàn)之一。DNA測序需要幾微克(μg)已純化的高分子量基因組DNA，且無污染和共生體。細(xì)菌污染可能影響測序，因?yàn)镈NA材料的隨機(jī)擴(kuò)增意味著細(xì)

菌DNA會(huì)與待分型的生物樣品一起被測序。

標(biāo)記的數(shù)量和類型：芯片技術(shù)與測序技術(shù)的最大差異在于芯片靶定特定的基因組區(qū)域或特定SNP的能力，如圖4所示?；谛酒募夹g(shù)能夠靶定特定染色體區(qū)域內(nèi)任何數(shù)量的標(biāo)記，其設(shè)計(jì)策略采用在基因組中均勻間隔的標(biāo)記，如有必要，采用基因組特定區(qū)域內(nèi)更高間隔的標(biāo)記。這種靈活性讓芯片可應(yīng)用于GWAS、12 QTL作圖、關(guān)聯(lián)作圖和基因組選擇，并具有一定量的確定偏差。通過在多個(gè)品種上開展SNP研究，可降低確定偏差。

表1：利用芯片和基于測序的基因分型技術(shù)對(duì)生物樣品進(jìn)行基因分型所需的DNA量。基于測序的基因分型技術(shù)所需的濃度是芯片的2倍至30倍。

基于測序的基因分型技術(shù)依賴DNA庫的隨機(jī)抽樣，而標(biāo)記的數(shù)量與待測序區(qū)域的數(shù)量和大小成正比。當(dāng)待研究群體的限制性位點(diǎn)保守時(shí)，基因組區(qū)域預(yù)計(jì)沒有偏差。因此，樣品間的標(biāo)記不保守，并且沒有兩個(gè)樣品能提供相同的一組標(biāo)記。這導(dǎo)致數(shù)據(jù)丟失，并需要

復(fù)雜的信息學(xué)通過推算來恢復(fù)丟失的數(shù)據(jù)。樣品間不保守的標(biāo)記必須通過參考基因組來推算，或利用覆蓋度非常高的測序(18倍或更高)通過相關(guān)品系的單倍型來推算。

選擇測序方法的考慮因素

對(duì)于上面提到的任何應(yīng)用，在決定采用哪種方法之前，必須考慮到影響基因分型的各種因素。

雜合子檢出錯(cuò)誤：基于測序的基因分型技術(shù)，尤其是GBS，依賴低覆蓋度來降低成本，并獲得大量標(biāo)記，這些標(biāo)記可用于關(guān)聯(lián)作圖。這種實(shí)驗(yàn)方法的缺點(diǎn)在于雜合子的檢出明顯過低，這影響了基因型準(zhǔn)確性。GBS檢出不足50%的雜合子。一項(xiàng)關(guān)于DNA測序所需覆蓋度的研究14預(yù)測，對(duì)于每個(gè)雜合二倍體，檢測99.75%位點(diǎn)上的兩個(gè)等位基因至少一次，需要13.5倍的深度。而檢測每個(gè)等位基因至少兩次，將需要18倍的深度。增加測序覆蓋度導(dǎo)致每個(gè)樣品的成本更高，并使得測序比芯片更為昂貴。關(guān)于葡萄的研究表明，以5.7倍的平均深度基因分型時(shí)，30-50%的雜合子未檢出。15 而芯片上雜合子的檢出準(zhǔn)確性是由芯片設(shè)計(jì)決定的，這是高度可預(yù)測的，使得基因型檢出準(zhǔn)確性接近100%。芯片所使用的進(jìn)一步設(shè)計(jì)方法能夠?qū)C含量高于60%的基因組區(qū)域進(jìn)行基因分型。

基因組覆蓋度：任何技術(shù)所帶來的標(biāo)記數(shù)量有望實(shí)現(xiàn)基因組的均一覆蓋?；跍y序的基因分型技術(shù)表現(xiàn)出數(shù)據(jù)丟失，這導(dǎo)致基因組的不均一覆蓋。丟失的數(shù)據(jù)是實(shí)驗(yàn)條件和基因組結(jié)構(gòu)的函數(shù)所造成，源于文庫復(fù)雜度(即獨(dú)特序列標(biāo)簽的數(shù)量)和文庫的序列覆蓋度的組合。丟失數(shù)據(jù)的量與文庫制備的多重水平以及RE消化所使用的酶直接相關(guān)。測序技術(shù)中限制性內(nèi)切酶的選擇影響了等位基因信號(hào)丟失，從而影響群體遺傳學(xué)的統(tǒng)計(jì)數(shù)據(jù)。稀有標(biāo)記需要切割不頻繁的酶，隨后產(chǎn)生較少的標(biāo)記。若使用頻繁切割的酶，會(huì)產(chǎn)生較多的標(biāo)記，但覆蓋度明顯降低，導(dǎo)致大量的數(shù)據(jù)丟失。

所有代表性降低的測序技術(shù)依賴基因組復(fù)雜度降低，從而降低成本并增加通量。復(fù)雜度降低的缺點(diǎn)在于所獲得的基因型數(shù)據(jù)有著明顯的丟失數(shù)據(jù)。16 基因型數(shù)據(jù)可能丟失，因?yàn)榛蚪M結(jié)構(gòu)中的內(nèi)在差異，如存在-缺失差異、多態(tài)性限制位點(diǎn)的變異，以及差異甲基化，這影響代表性降低的測序技術(shù)中所使用的甲基化敏感的酶。丟失的數(shù)據(jù)對(duì)QTL作圖很重要，其中親本系的基因型數(shù)據(jù)質(zhì)量對(duì)作圖群體的基因型檢出至關(guān)重要。親本系需要以非常高的覆蓋度測序。

圖5：說明了序列覆蓋度與丟失數(shù)據(jù)之間的關(guān)系，這項(xiàng)結(jié)果是由近期一篇論文發(fā)表的，它比較了不同平臺(tái)上基于測序的基因分型。17 此研究表明，在10倍覆蓋度下，可獲得1,000個(gè)標(biāo)記，且50%的數(shù)據(jù)丟失，而低覆蓋度下的標(biāo)記數(shù)量增加至30,000個(gè)時(shí)，90%的數(shù)據(jù)丟失。

基因型數(shù)據(jù)的預(yù)期量和實(shí)際量可能差異巨大。近期一項(xiàng)使用GBS的玉米研究18表明，基因組位置分布的傾斜覆蓋和不成比例的區(qū)域不代表最初預(yù)計(jì)的信息。這限制了測序技術(shù)的范圍和應(yīng)用，被認(rèn)為無法用于關(guān)聯(lián)研究的精細(xì)作圖。大多數(shù)位點(diǎn)的基因型數(shù)據(jù)只能通過大幅增加read深度來實(shí)現(xiàn)，而這會(huì)影響測序成本。

丟失的數(shù)據(jù)可利用數(shù)據(jù)推算技術(shù)來恢復(fù)，也就是將數(shù)據(jù)與參考基因組比對(duì)，這需要大量的投資、先進(jìn)的分析，以及復(fù)雜的流程，能過濾、排序并比對(duì)序列數(shù)據(jù)。缺乏簡單易用且統(tǒng)一的信息學(xué)流程仍然是在常規(guī)應(yīng)用中采用基于測序的基因分型技術(shù)的第二大障礙。推算特別適合親緣關(guān)系相近的個(gè)體，但對(duì)于高度多樣化的樣品，丟失的數(shù)據(jù)可替換為近鄰的等位基因。19 當(dāng)丟失數(shù)據(jù)的比例高時(shí)，基于測序的基因分型技術(shù)也會(huì)丟失低頻率的等位基因。替代方案是追求更高深度的測序，這會(huì)導(dǎo)致每個(gè)樣品的成本更高。

LD和多態(tài)性頻率：對(duì)于收集基因型數(shù)據(jù)的群體而言，它的基因組多樣性和交配系統(tǒng)對(duì)測序成本有很大的影響。從一個(gè)較窄的遺傳基礎(chǔ)衍生而來的群體表現(xiàn)出較少的多態(tài)性，需要更多的測序，并增加總成本。四倍體棉花等物種便是如此，其每1,000-1,500個(gè)堿基表現(xiàn)出一個(gè)多態(tài)性。物種內(nèi)的LD衰減也決定了多個(gè)群體的關(guān)聯(lián)作圖所需的標(biāo)記數(shù)量。圖6顯示了LD衰減對(duì)標(biāo)記分辨率的影響。對(duì)LD衰減高的物種而言，標(biāo)記密度的低分辨率將導(dǎo)致基因組的覆蓋度不足。水產(chǎn)養(yǎng)殖物種(如鱒魚)和植物(包括玉米、葡萄和甜菜)表現(xiàn)出低的LD，在關(guān)聯(lián)分析時(shí)需要大量的片段。近期一項(xiàng)關(guān)于鱒魚的全基因組關(guān)聯(lián)研究20使用了基于測序的基因分型技術(shù)，并得出結(jié)論，LD的快速衰減需要更高水平的標(biāo)記密度，才能高效地開展全基因組關(guān)聯(lián)研究。

拷貝數(shù)應(yīng)用：基于芯片和測序的基因分型技術(shù)可被用來開展拷貝數(shù)研究，以鑒定復(fù)雜性狀的遺傳變異。這兩種技術(shù)都能檢測拷貝數(shù)獲得。但基于測序的基因分型技術(shù)在低覆蓋度下難以鑒定拷貝數(shù)丟失，因?yàn)槠蝸G失顯示為低覆蓋度的標(biāo)記。21 更高覆蓋度將實(shí)現(xiàn)CNV丟失的檢測，但成本有望增加40-50%。

基因組復(fù)雜度：多倍性是植物和某些動(dòng)物的更復(fù)雜屬性之一。60-70%的被子植物是多倍體，其倍性水平從葡萄籽的四倍體到草莓的八倍體，而甘蔗更為復(fù)雜，其倍性水平從12-16倍不等。多倍體物種表現(xiàn)出基因組復(fù)制。多倍體的挑戰(zhàn)如下：(i) 多倍體物種需要更高的序列覆蓋度，才能高效覆蓋更大的基因組，而這增加了測序成本。(ii) 基因組組裝和作圖算法很復(fù)雜，容易出錯(cuò)，特別是在組裝旁系同源/直系同源區(qū)域時(shí)。對(duì)于多倍體且雜合的物種，每個(gè)指定位點(diǎn)的數(shù)據(jù)推算都需要復(fù)雜的分析流程，而這不能用于常規(guī)的育種應(yīng)用。22 此外，更深度的測序增加了總成本。測定基因組中每個(gè)位點(diǎn)的等位基因劑量信息對(duì)基因組選擇模式很重要。在使用芯片對(duì)多倍體物種進(jìn)行基因分型時(shí)，來自亞基因組的信號(hào)導(dǎo)致聚類壓縮。多倍體物種也表現(xiàn)出不同水平的倍性，因?yàn)楦蓴_突變導(dǎo)致復(fù)雜度降低。常規(guī)的育種應(yīng)用必須有一個(gè)分析流程，能自動(dòng)聚類并分配基因型，以滿足嚴(yán)格的育種時(shí)限要求。Axiom? GT1算法用貝葉斯統(tǒng)計(jì)來準(zhǔn)確分配基因型并讓多倍體基因組的數(shù)據(jù)聚類。圖7顯示了一個(gè)例子。自動(dòng)流程讓人們能夠輕松準(zhǔn)確地對(duì)數(shù)千個(gè)樣品的數(shù)千個(gè)標(biāo)記進(jìn)行基因分型。

為您的基因分型項(xiàng)目選擇適當(dāng)方案的指南：鑒于芯片技術(shù)和測序技術(shù)的進(jìn)步，科學(xué)家們需要認(rèn)識(shí)到使用測序技術(shù)的挑戰(zhàn)，以及使用測序和芯片技術(shù)的偏向。下列問題可幫助您選擇適當(dāng)?shù)募夹g(shù)，應(yīng)用在科研或基因組育種項(xiàng)目所考慮的物種上：

n 獲取基因型數(shù)據(jù)所使用的分析是否與所考慮物種的基因組結(jié)構(gòu)兼容，它是否能帶來足夠量的可靠標(biāo)記？

n 是否有需要靶定特定染色體區(qū)域，需要采用何種標(biāo)記策略以覆蓋整個(gè)基因組？

n 所考慮物種的潛在LD結(jié)構(gòu)如何？

n 此物種是不是多倍體，倍性水平如何？

n 將此技術(shù)引入科研或育種項(xiàng)目需要哪種信息學(xué)流程和專業(yè)知識(shí)？

n 需要多少個(gè)小時(shí)才能檢出基因型并聚類數(shù)據(jù)？

n 所考慮的群體是近交群體，還是多樣化的無關(guān)個(gè)體，預(yù)計(jì)雜合水平如何？

n 需要對(duì)多少個(gè)樣品進(jìn)行基因分型，周轉(zhuǎn)時(shí)間或出結(jié)果的時(shí)間是否有限制？

n 需要何種深度的序列覆蓋，才能準(zhǔn)確檢出基因型？

n 數(shù)據(jù)缺口有什么影響，您將如何恢復(fù)丟失的基因型？

n 考慮到丟失數(shù)據(jù)和生物信息學(xué)流程和分析所需的資源，分析的成本如何？

n 技術(shù)的通量、周轉(zhuǎn)時(shí)間、分析的可靠性以及技術(shù)所使用的儀器如何？

n 育種項(xiàng)目可接受的偏差量如何，是否有辦法繞過偏差？

n 需要將多少種不同的技術(shù)或分析整合到科研或育種項(xiàng)目中，進(jìn)行有效驗(yàn)證、標(biāo)記性狀或常規(guī)使用？

芯片技術(shù)不斷發(fā)展，形成Axiom? 384HT的格式。這個(gè)能以非常經(jīng)濟(jì)的價(jià)格點(diǎn)同時(shí)處理384個(gè)樣品的創(chuàng)新讓此技術(shù)從科研走向主流的商業(yè)化農(nóng)業(yè)基因組學(xué)。在優(yōu)先考慮周轉(zhuǎn)時(shí)間、易用性和數(shù)據(jù)質(zhì)量的應(yīng)用中，芯片仍然是理想技術(shù)。

基于芯片的技術(shù)在單一平臺(tái)上合并了多個(gè)基因分型應(yīng)用，提供了靈活性和經(jīng)濟(jì)性。分析和信息學(xué)分析流程的創(chuàng)新讓所有感興趣的相關(guān)標(biāo)記能夠不受限制地基因分型，其結(jié)果可通過簡單的流程在幾小時(shí)內(nèi)得到。Axiom?基因分型解決方案，來自Affymetrix的芯片

技術(shù)演化，為全基因組分析到常規(guī)篩查的應(yīng)用提供了完整的解決方案，具有高準(zhǔn)確性和重復(fù)性、簡化的流程和低成本。

基于測序的基因分型技術(shù)的挑戰(zhàn)總結(jié)在表2。

表2：表2比較了基于測序的基因分型技術(shù)(如RADseq和GBS)與Axiom? Genotyping Arrays的特點(diǎn)。新技術(shù)由于忽視了實(shí)際實(shí)驗(yàn)條件和基因組復(fù)雜度而呈現(xiàn)的較低成本，卻往往被宣傳為替代芯片技術(shù)的理由。

Affymetrix的農(nóng)業(yè)基因組學(xué)基因分型方案為育種人員和研究人員提供了一種強(qiáng)大而經(jīng)濟(jì)的工具，可鑒定、驗(yàn)證和篩查植物或動(dòng)物中復(fù)雜的遺傳性狀，實(shí)現(xiàn)更快速、更精確的育種。Axiom?基因分型一開始是從SNP文庫資源中選擇標(biāo)記內(nèi)容，接著設(shè)計(jì)SNP芯片，最后用芯片來鑒定樣品的基因型。這為育種人員和研究人員提供了一種功能性的基因分型工具，讓其應(yīng)用在標(biāo)記-性狀關(guān)聯(lián)、全基因組關(guān)聯(lián)研究(GWAS)、數(shù)量性狀位點(diǎn)(QTL)分析和基因組選擇項(xiàng)目中。

鑒于genotyping-by-sequencing技術(shù)在數(shù)據(jù)管理、計(jì)算需求上的挑戰(zhàn)，且定制信息學(xué)流程需要根據(jù)每個(gè)物種和樣品群體來定制，芯片在數(shù)據(jù)質(zhì)量、完整性、分析和常規(guī)育種的應(yīng)用上是很簡單的技術(shù)。

總的來說，適用于動(dòng)物和植物基因分型的Axiom?基因分型解決方案讓人們能夠?yàn)榫哂猩虡I(yè)價(jià)值的物種定制芯片上的基因分型內(nèi)容。Axiom基因分型解決方案包括物種特異和定制的芯片，其經(jīng)過驗(yàn)證的基因組內(nèi)容來自Axiom?基因組數(shù)據(jù)庫，以及完整的試劑盒、數(shù)據(jù)分析工具，和一個(gè)利用GeneTitan?多通道(MC)儀器的全自動(dòng)流程。

References and publications

1 Baird N. A., et al. Rapid SNP discovery and genetic mapping using sequenced RAD markers. PLoS ONE 3:e3376 (2008). doi:10.1371/journal.pone.0003376

2 Elshire R. J., et al. A robust, simple genotyping-by-sequencing (GBS) approach for high diversity species. PLoS ONE 6:e19379 (2011). doi:10.1371/journal.pone.0019379

3 Narum S. R., et al. Genotyping-by-sequencing in ecological and conservation genomics. Molecular Ecology 22: 2841?2847 (2013). doi:10.1111/mec.12350

4 Peterson B. K., et al. Double digest RADseq: an inexpensive method for de novo SNP discovery and genotyping in model and non-model species. PLoS ONE 7(5):e37135 (2012).

doi:10.1371/journal.pone.0037135

5 Kranis A., et al. Development of a high density 600K SNP genotyping array for chicken. BMC Genomics 14:59 (2013). doi:10.1186/1471-2164-14-59

6 Houston R. D., et al. Development and validation of a high density SNP genotyping array for Atlantic salmon (Salmo salar). BMC Genomics 15:90 (2014). doi:10.1186/1471-

2164-15-90

7 Affymetrix application note Mitigating sequencing errors, monomorphs, and poor performing markers during de novo SNP selection for genotyping applications (2013) P/N

DNA02261 Rev. 1

8 Ersoz E. S., Yu J., Buckler E. S. Applications of linkage disequilibrium and association mapping in crop plants, in Genomics-Assisted Crop Improvement: vol 1: Genomics

Approaches and Platforms, eds. Varshney R. K., Tuberosa R. Springer, pp. 97-119 (2007). doi:10.1007/978-1-4020-6295-7_5

9 Poland J. A., et al. Genotyping-by-sequencing for plant breeding and genetics. The Plant Genome 5(3):92?102 (2012). doi:10.3835/plantgenome2012.05.0005

10 Meuwissen T., et al. Accelerating improvement of livestock with genomic selection. Annual Review of Animal Biosciences 1:221-237 (2013). doi:10.1146/annurevanimal-

031412?103705

11 Hui L., et al. An evaluation of genotyping by sequencing (GBS) to map the Breviaristatum-e (ari-e) locus in cultivated barley. BMC Genomics 15:104 (2014). doi:10.1186/1471-

2164-15-104

12 Liu S., et al. Development of the catfish 250K SNP array for genome-wide association studies. BMC Research Notes 7:135 (2014). doi:10.1186/1756-0500-7-135

13 Cavangh C. R., et al. Genome-wide comparative diversity uncovers multiple targets of selection for improvement in hexaploid wheat landraces and cultivars. 110(20):8057–8062.

doi:10.1073/pnas.1217133110

14 Wendl M. C., et al. Aspects of coverage in medical DNA sequencing. BMC Bioinformatics 9:239 (2008). doi: 10.1186/1471-2105-9-239

15 Hyma K. E., GBS Usage Cases: Non-model Organisms. (2013). http://cbsu.tc.cornell.edu/lab/doc/GBS_nonmodel_Sept_2013.pdf

16 Davey J. W., et al. Genome-wide genetic marker discovery and genotyping using next-generation sequencing. Nature Reviews Genetics 12(7):499–510 (2011). doi:10.1038/

nrg3012

17 Mascher M., et al. Application of genotyping-by-sequencing on semiconductor sequencing platforms: a comparison of genetic and reference-based marker ordering in barley.

PLoS ONE 8(10):e76925 (2013). doi:10.1371/journal.pone.0076925

18 Beissinger T. M., et al. Marker density and read depth for genotyping populations using genotyping-by-sequencing. Genetics 193(4):1073–1081 (2013). doi:10.1534/

genetics.112.147710

19 Huang X., et al. Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics 42(11):961?967 (2010). doi:10.1038/ng.695

20 Rexroad C. E., et al. Estimates of linkage disequilibrium and effective population size in rainbow trout. BMC Genetics 10:83 (2009). doi:10.1186/1471-2156-10-83

21 Donato MD et. al. Genotyping-by-sequencing (GBS): a novel, efficient and cost-effective genotyping method for cattle using next- generation sequencing. PLoS ONE 8(5):

e62137. doi:10.1371/journal.pone.0062137.

22 Brummer, et al. Applied genetics and genomics in alfalfa breeding. Agronomy 2:40-61 (2012). doi:10.3390/agronomy2010040

來自Affymetrix的農(nóng)業(yè)基因組學(xué)解決方案為育種者和研究人員提供了一系列強(qiáng)大而靈活的基因分型工具，

可經(jīng)濟(jì)高效地鑒定、驗(yàn)證并篩查植物和動(dòng)物中的復(fù)雜遺傳性狀。

來自Affymetrix的農(nóng)業(yè)基因組學(xué)解決方案為育種者和研究人員提供了一系列強(qiáng)大而靈活的基因分型工具，

可經(jīng)濟(jì)高效地鑒定、驗(yàn)證并篩查植物和動(dòng)物中的復(fù)雜遺傳性狀。

來自Affymetrix的農(nóng)業(yè)基因組學(xué)解決方