中國教育報-中國教育新聞網(wǎng)訊(記者 馮麗)記者日前從西安交通大學獲悉,該校葉凱教授團隊在高質(zhì)量基因注釋研究方面獲得重要突破,相關(guān)成果3月12日在線發(fā)表于國際頂級期刊《自然·方法》(Nature Methods)。
基因注釋是連接“測出基因組”和“讀懂基因組”的核心環(huán)節(jié),是基因組研究走向功能解析和應(yīng)用轉(zhuǎn)化的重要基礎(chǔ)。隨著國際大型基因組計劃持續(xù)產(chǎn)出海量數(shù)據(jù),如何實現(xiàn)高質(zhì)量基因注釋已成為后基因組時代亟待突破的重要瓶頸。
傳統(tǒng)方法通常依賴RNA測序、同源蛋白等外部證據(jù),存在數(shù)據(jù)需求高、計算開銷大、對數(shù)據(jù)匱乏物種適用性受限等問題。針對這一挑戰(zhàn),葉凱教授團隊提出了一種基于混合專家架構(gòu)的基因組語言模型ANNEVO。該方法能夠同時學習不同生物類群的進化規(guī)律和長距離序列上下文關(guān)系,在無需RNA測序和同源蛋白等外部證據(jù)的條件下,僅憑DNA序列即可實現(xiàn)高精度從頭基因注釋,打破國外尤其是德國團隊在該領(lǐng)域20余年的技術(shù)壟斷,推動我國在基因注釋核心方法上實現(xiàn)重要突破,對于服務(wù)國家生物安全戰(zhàn)略、AI+生命交叉融合發(fā)展具有重要意義。
據(jù)悉,該研究團隊長期圍繞“人工智能驅(qū)動基因組解析”開展系統(tǒng)布局,此前已相繼提出SVision(《自然·方法》,2022)、SVision-pro(《自然·生物技術(shù)》,2024)和Swave(《自然·遺傳》,2026)等方法。此次ANNEVO的提出,進一步完善了團隊在“AI驅(qū)動基因組解析”方向上的系列工作布局,形成了從基因組變異識別到基因功能注釋的連續(xù)方法鏈條,已在Darwin Tree of Life等國際旗艦基因組計劃場景中展現(xiàn)出重要應(yīng)用價值。
工信部備案號:京ICP備05071141號
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024
中國教育報刊社主辦 中國教育新聞網(wǎng)版權(quán)所有,未經(jīng)書面授權(quán)禁止下載使用
Copyright@2000-2022 www.weilaiguolv0015.com All Rights Reserved.