(相關(guān)資料圖)
科技日?qǐng)?bào)北京9月18日電 (記者張夢(mèng)然)在過(guò)去兩年中,機(jī)器學(xué)習(xí)徹底改變了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。現(xiàn)在,《科學(xué)》雜志上的3篇論文描述了蛋白質(zhì)設(shè)計(jì)方面的革命:華盛頓大學(xué)醫(yī)學(xué)院生物學(xué)家的研究表明,機(jī)器學(xué)習(xí)可比以前更準(zhǔn)確、更快速地創(chuàng)建蛋白質(zhì)分子。科學(xué)家們希望這一進(jìn)步將帶來(lái)更多新的疫苗、療法、碳捕獲工具和可持續(xù)生物材料。
論文資深作者、華盛頓大學(xué)醫(yī)學(xué)院生物化學(xué)教授、2021年生命科學(xué)突破獎(jiǎng)獲得者大衛(wèi)·貝克表示,蛋白質(zhì)是整個(gè)生物學(xué)的基礎(chǔ),但迄今在每種植物、動(dòng)物和微生物中發(fā)現(xiàn)的蛋白質(zhì),遠(yuǎn)不到所有可能蛋白質(zhì)的百分之一。有了這些新的軟件工具,研究人員應(yīng)該能夠找到解決醫(yī)學(xué)、能源和技術(shù)方面長(zhǎng)期挑戰(zhàn)的方案。
為了超越自然界中發(fā)現(xiàn)的蛋白質(zhì),貝克團(tuán)隊(duì)成員將蛋白質(zhì)設(shè)計(jì)的挑戰(zhàn)分解為3個(gè)部分,并為每個(gè)部分使用新的軟件解決方案。
首先,必須生成新的蛋白質(zhì)形狀。在《科學(xué)》雜志上稍早發(fā)表的論文中,該團(tuán)隊(duì)設(shè)計(jì)人工智能(AI)通過(guò)兩種方式生成新的蛋白質(zhì)形狀:第一種稱為“幻覺”,類似于基于簡(jiǎn)單提示就能產(chǎn)生輸出的工具;第二種稱為“修復(fù)”,類似于現(xiàn)代搜索欄中的自動(dòng)完成功能。
其次,為加快這一過(guò)程,團(tuán)隊(duì)設(shè)計(jì)了一種生成氨基酸序列的新算法。15日發(fā)表的論文描述了這個(gè)名為ProteinMPNN的工具,運(yùn)行時(shí)間約為1秒,比以前最好的軟件快200多倍。它不但結(jié)果優(yōu)于以前的工具,還不需要專家定制即可運(yùn)行。
第三,該團(tuán)隊(duì)使用“深度思維”公司開發(fā)的“阿爾法折疊”來(lái)獨(dú)立評(píng)估他們提出的氨基酸序列是否可能折疊成預(yù)期的形狀。
研究人員表示,預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的軟件是解決方案的一部分,但它本身無(wú)法提出任何新的東西。ProteinMPNN之于蛋白質(zhì)設(shè)計(jì),就像“阿爾法折疊”之于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。
在另一篇論文中,貝克實(shí)驗(yàn)室的一個(gè)團(tuán)隊(duì)證實(shí),新機(jī)器學(xué)習(xí)工具的組合能可靠地生成在實(shí)驗(yàn)室中起作用的新蛋白質(zhì)。
研究發(fā)現(xiàn),新制造的蛋白質(zhì)更有可能按預(yù)期折疊,因此可使用這一方法創(chuàng)建非常復(fù)雜的蛋白質(zhì)組裝體。“這是蛋白質(zhì)設(shè)計(jì)中機(jī)器學(xué)習(xí)的開端。”貝克說(shuō)。
標(biāo)簽: 機(jī)器學(xué)習(xí) 阿爾法折疊 人工智能