一年前,人工智能(AI)公司DeepMind等依靠其推出的AI系統(tǒng)AlphaFold預(yù)測(cè)并公布了約35萬(wàn)種蛋白質(zhì)的結(jié)構(gòu)。這讓許多科學(xué)家大吃一驚,該進(jìn)展入選《科學(xué)》2021年度十大科學(xué)突破。
一年后,AlphaFold完成又一次飛躍。據(jù)《科學(xué)》報(bào)道,7月28日,DeepMind公布了從細(xì)菌到人類的幾乎所有已知(2億多個(gè))蛋白質(zhì)的可能結(jié)構(gòu),并將其納入相關(guān)數(shù)據(jù)庫(kù),研究人員可免費(fèi)搜索蛋白質(zhì)結(jié)構(gòu)。
【資料圖】
這是人工智能領(lǐng)域的一個(gè)驚人成就,也是藥物開(kāi)發(fā)和迭代研究的潛在寶庫(kù)。
“我們發(fā)布了整個(gè)蛋白質(zhì)宇宙的結(jié)構(gòu)。”DeepMind聯(lián)合創(chuàng)始人、首席執(zhí)行官Demis Hassabis在新聞發(fā)布會(huì)上說(shuō)。
AlphaFold功能強(qiáng)大,它解決了從蛋白質(zhì)氨基酸序列中準(zhǔn)確推導(dǎo)蛋白質(zhì)三維結(jié)構(gòu)的長(zhǎng)期挑戰(zhàn)——蛋白質(zhì)折疊問(wèn)題。大多數(shù)藥物都是利用蛋白質(zhì)結(jié)構(gòu)信息設(shè)計(jì)的,準(zhǔn)確描繪結(jié)構(gòu)圖譜往往是發(fā)現(xiàn)蛋白質(zhì)如何工作的第一步。
通過(guò)與歐洲生物信息學(xué)研究所(EMBL-EBI)合作,AlphaFold數(shù)據(jù)庫(kù)也于一年前啟動(dòng),其中納入的35萬(wàn)個(gè)蛋白質(zhì)預(yù)測(cè)結(jié)構(gòu)涵蓋了人類、小鼠和其他19種被廣泛研究的生物體產(chǎn)生的幾乎每種蛋白質(zhì)。
AlphaFold新預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)也已發(fā)布到現(xiàn)有數(shù)據(jù)庫(kù)中。Hassabis說(shuō),該數(shù)據(jù)庫(kù)“為結(jié)構(gòu)生物學(xué)家提供了強(qiáng)大的新工具,在這里,可以像在谷歌通過(guò)關(guān)鍵詞搜索信息一樣輕松地查找蛋白質(zhì)三維結(jié)構(gòu)”。
據(jù)EMBL-EBI估計(jì),在現(xiàn)有的超2.14億個(gè)預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)中,大約35%是高度準(zhǔn)確的,這意味著它們與實(shí)驗(yàn)確定的結(jié)構(gòu)質(zhì)量一樣高;有45%的結(jié)構(gòu)足以在許多應(yīng)用程序中使用。
DeepMind表示,自去年發(fā)布部分蛋白質(zhì)結(jié)構(gòu)以來(lái),已有超過(guò)50萬(wàn)名研究人員使用了該數(shù)據(jù)庫(kù)。
Hassabis預(yù)見(jiàn)了一個(gè)“數(shù)字生物學(xué)新時(shí)代”,在這個(gè)時(shí)代里,藥物開(kāi)發(fā)人員可以從利用AI預(yù)測(cè)醫(yī)學(xué)上很重要的蛋白質(zhì)結(jié)構(gòu),轉(zhuǎn)向使用AI設(shè)計(jì)影響這些蛋白質(zhì)的小分子,從而治療疾病。
其他人正在通過(guò)結(jié)構(gòu)預(yù)測(cè)開(kāi)發(fā)候選疫苗,探索如核孔復(fù)合體如何把分子送入細(xì)胞核或者生命最初進(jìn)化時(shí)蛋白質(zhì)如何進(jìn)化等基本生物學(xué)問(wèn)題。
在Hassabis看來(lái),公布蛋白質(zhì)結(jié)構(gòu)只是一個(gè)起點(diǎn),還有許多生物學(xué)和化學(xué)方面的工作有待探索。
標(biāo)簽: