人工智能助力RNA病毒研究
2024/10/11 17:13 來(lái)源:光明網(wǎng) 閱讀:1.2萬(wàn)
10月9日,,中山大學(xué)醫(yī)學(xué)院施莽教授團(tuán)隊(duì)與阿里云李兆融團(tuán)隊(duì)在《細(xì)胞》雜志發(fā)表論文,報(bào)告了全球范圍的180個(gè)超群,、16萬(wàn)余種的RNA病毒發(fā)現(xiàn),,大幅擴(kuò)展全球RNA病毒的多樣性,。該研究將人工智能技術(shù)應(yīng)用于病毒鑒定,探索了病毒學(xué)研究的新路徑,。
傳統(tǒng)的病毒發(fā)現(xiàn)方法高度依賴既有知識(shí),,面對(duì)RNA病毒這種高度分化、種類(lèi)繁多且容易變異的病毒識(shí)別效率低,。在該研究中,,研究團(tuán)隊(duì)開(kāi)發(fā)了一種人工智能算法,其能對(duì)病毒和非病毒基因組序列深度學(xué)習(xí),,并自主判斷病毒序列,。利用這套算法,研究團(tuán)隊(duì)在來(lái)自全球生物環(huán)境樣本的10487份RNA測(cè)序數(shù)據(jù)中發(fā)現(xiàn)了超過(guò)51萬(wàn)條病毒基因組,,代表超過(guò)16萬(wàn)個(gè)潛在病毒種及180個(gè)RNA病毒超群,。其中23個(gè)超群無(wú)法通過(guò)序列同源方法識(shí)別,,被稱為病毒圈的“暗物質(zhì)”。
通過(guò)進(jìn)一步分析,,研究團(tuán)隊(duì)報(bào)告了迄今最長(zhǎng)的RNA病毒基因組,,長(zhǎng)度達(dá)到47250個(gè)核苷酸;發(fā)現(xiàn)了超出以往認(rèn)知的基因組結(jié)構(gòu),,展現(xiàn)出RNA病毒基因組進(jìn)化的靈活性,;識(shí)別到多種病毒功能蛋白,特別是與細(xì)菌相關(guān)的功能蛋白,,進(jìn)一步表明還有更多類(lèi)型的RNA噬菌體亟待探索,;發(fā)現(xiàn)在南極底泥、深海熱泉,、活性污泥和鹽堿灘等極端環(huán)境中,,RNA病毒的數(shù)量和多樣性仍然較高。
“人工智能的算法模型能夠挖掘出我們之前忽略或根本不知道的病毒,,這在疾病防控和新病原的快速識(shí)別中尤為重要,。特別是在疫情暴發(fā)時(shí),人工智能的速度和精度可以幫助科學(xué)家更快地鎖定潛在病原體,?!笔┟дf(shuō)。(記者 吳春燕 唐一歌 通訊員 朱嘉豪 李建平)