香蕉是當今世界產(chǎn)量最高的水果,是熱帶、亞熱帶地區(qū)的主要糧食作物之一。栽培香蕉起源復雜,基因組雜合度高、分型困難,導致其基因組研究相對落后于其它栽培作物。三倍體香蕉是全球栽培香蕉的主力軍,其中Cavendish香蕉(AAA)因為易于運輸而被大量栽種,其產(chǎn)量約占據(jù)香蕉市場的50%。Cavendish香蕉高質(zhì)量分型基因組的組裝和注釋將有助于深刻理解栽培香蕉的起源和馴化歷史,為香蕉種質(zhì)資源的遺傳評價和種質(zhì)創(chuàng)新奠定堅實基礎(chǔ)。
2023年8月,Horticulture Research在線發(fā)表了中國科學院華南植物園、熱帶作物生物育種全國實驗室-中國農(nóng)業(yè)科學院深圳農(nóng)業(yè)基因組研究所和廣西民族大學合作完成的題為“Telomere-to-telomere haplotype-resolved reference genome reveals subgenome divergence and disease resistance in triploid Cavendish banana”的研究論文。這是首次報道三倍體栽培香蕉的高質(zhì)量分型參考基因組,是繼2012年首個野生芭蕉基因組草圖發(fā)表后,香蕉基因組學領(lǐng)域中又一里程碑事件。

圖1. 巴西蕉
該研究使用PacBio HiFi、ONT ultra-long和Hi-C測序數(shù)據(jù),對巴西蕉(Cavendish的一個高產(chǎn)和優(yōu)質(zhì)品種)進行了從端粒到端粒(telomere-to-telomere,T2T)且區(qū)分單倍型的從頭組裝(圖2A、2B)。三個組裝的單倍型基因組的大小分別為477.16 Mb、477.18 Mb和469.57 Mb,基因組總大小為1.42Gb。分別識別到19、17和17個端粒,除2號和10號染色體外均存在無端粒缺失染色體。經(jīng)過補洞后全基因組僅在BXJ2上存在2個gap。BXJ1、BXJ2和BXJ3組裝BUSCO評估分別為97.40%,97.80%和93.80%(圖2E)。BXJ1注釋了37,185個蛋白編碼基因,重復序列比例為53.76%。BXJ2注釋了37,241個蛋白編碼基因基因,重復序列比例為54.14%。BXJ3注釋了37,178個蛋白編碼基因,重復序列比例為55.13%。

圖2. 巴西蕉基因組特征。
巴西蕉雖然具有單系起源,但三套亞基因組間顯示出較大的差異,序列共線性水平較低(圖2F)。此外,在不同亞基因組的不同染色體上,發(fā)現(xiàn)存在部分明顯的易位,主要集中于1號、4號和7號染色體。隨后,作者對基因家族擴張收縮歷史進行模擬,發(fā)現(xiàn)與果實品質(zhì)及風味相關(guān)的基因家族發(fā)生了顯著的擴張,包括蔗糖/二糖/寡糖代謝通路、淀粉代謝通路以及芳香物質(zhì)合成相關(guān)通路。另一部分顯著擴張的基因家族則富集到花粉發(fā)育通路,這可能和巴西蕉的單性結(jié)實和不育相關(guān)。作者進一步對巴西蕉全基因組的抗性基因進行篩選,發(fā)現(xiàn)相對野生芭蕉,巴西蕉中存在更少的抗性基因,特別是在3號以及10號染色體上的基因簇。長期以來,枯萎病嚴重威脅香蕉生長,作者發(fā)現(xiàn)3號抗性基因簇所在的區(qū)間正好位于此前報道的野生芭蕉抵抗枯萎病的QTL上,反映更少的抗性基因可能與巴西蕉易感枯萎病相關(guān)(圖3)。此外,作者首次在香蕉中解析了多倍體亞基因組的差異表達模式,發(fā)現(xiàn)亞基因組間呈現(xiàn)高度差異表達,進一步印證了巴西蕉亞基因組之間的分化。三倍體香蕉基因組的成功解析為香蕉遺傳學和育種提供了重要資源。

圖3. NLR抗性位點在小果野蕉(MAv4)和巴西蕉基因組上的分布。
中國科學院華南植物園副研究員\碩士生指導教師黃慧潤、中國科學院大學2021級碩士研究生劉鑫以及熱帶作物生物育種全國實驗室-中國農(nóng)業(yè)科學院深圳基因組研究所博士研究生Rida Arshad為論文共同第一作者。熱帶作物生物育種全國實驗室-中國農(nóng)業(yè)科學院深圳基因組研究所博士研究生王旭和廣西民族大學李偉明副研究員參與了該項研究工作。中國科學院華南植物園葛學軍研究員和熱帶作物生物育種全國實驗室-中國農(nóng)業(yè)科學院深圳基因組研究所周永鋒研究員為論文通訊作者。該研究得到了國家自然科學基金(32070237,31261140366)以及中國科學院先導戰(zhàn)略專項(XDB31000000)資助支持。
文章鏈接:https://doi.org/10.1093/hr/uhad153