給基因編輯插上人工智能的翅膀會(huì)發(fā)生什么?
中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所(以下簡稱遺傳發(fā)育所)研究員高彩霞和團(tuán)隊(duì)進(jìn)行了一次試水,意外為基因編輯新“利器”的挖掘開辟了一片嶄新的天地。
基因編輯技術(shù)自2012年誕生以來就被喻為“上帝的手術(shù)刀”,打開了人類改寫生命基因密碼的大門。2020年,這項(xiàng)對(duì)生命科學(xué)領(lǐng)域產(chǎn)生顛覆性影響的工具眾望所歸地獲得了諾貝爾化學(xué)獎(jiǎng)。為了讓這這把“手術(shù)刀”更精準(zhǔn)、高效,科學(xué)家們還在不斷向前推動(dòng)著這一技術(shù)的研究邊界。
(相關(guān)資料圖)
近期,高彩霞和團(tuán)隊(duì)開創(chuàng)性地運(yùn)用AlphaFold2輔助蛋白結(jié)構(gòu)預(yù)測(cè),并對(duì)不同蛋白基于結(jié)構(gòu)進(jìn)行分類,開發(fā)出一系列堿基編輯新利器,它們?cè)卺t(yī)學(xué)和農(nóng)業(yè)方面具有廣泛的應(yīng)用潛力。相關(guān)研究6月27日在線發(fā)表于《細(xì)胞》。
“這項(xiàng)研究在多個(gè)方面都令人興奮?!痹摽晃粐H審稿人說。
一次試水
高彩霞團(tuán)隊(duì)是中國農(nóng)業(yè)基因編輯領(lǐng)域的一張名片。
2013年,高彩霞帶領(lǐng)團(tuán)隊(duì)發(fā)表了世界上第一篇CRISPR基因編輯植物的研究論文。十年來,他們不斷完善著這把生命科學(xué)的“手術(shù)刀”,獲得的基因編輯技術(shù)專利可占據(jù)國內(nèi)半壁江山,并探索了這些工具在水稻、小麥、玉米和番茄等農(nóng)作物在育種方面的潛力。
“當(dāng)一項(xiàng)技術(shù)具有顛覆性時(shí),科學(xué)家總會(huì)考慮它的缺點(diǎn),然后讓它更完善?!备卟氏紝?duì)《中國科學(xué)報(bào)》說。
十余年來,基因編輯技術(shù)不斷迭代并迅猛發(fā)展。高彩霞將現(xiàn)有基因編輯技術(shù)劃分為兩個(gè)階段。
1.0時(shí)代的基因編輯,以“基因剪刀”CRISPR-Cas9技術(shù)為代表,它能在基因組特定位置產(chǎn)生DNA雙鏈斷裂,繼而通過細(xì)胞內(nèi)源修復(fù)機(jī)制產(chǎn)生隨機(jī)小片段進(jìn)行插入或刪除,但產(chǎn)生的突變存在不可控性。
2.0時(shí)代的基因編輯,以堿基編輯和引導(dǎo)編輯技術(shù)為代表,其特點(diǎn)是“精準(zhǔn)”。所有生物的DNA都由A、T、C、G四個(gè)字母所代表的堿基組成,堿基編輯可不依賴DNA雙鏈斷裂實(shí)現(xiàn)部分特定堿基(如字母A-T、C-G、A-G)的高效精準(zhǔn)替換,但仍無法實(shí)現(xiàn)所有字母的任意轉(zhuǎn)換。在此基礎(chǔ)上,2.0+版的引導(dǎo)編輯系統(tǒng),則可實(shí)現(xiàn)4個(gè)字母任意編輯,以及小片段DNA的精準(zhǔn)插入和刪除。
不過,這樣的基因編輯技術(shù)仍非完美無缺。
現(xiàn)有堿基編輯系統(tǒng)的核心元件——脫氨酶來源于單一家族,在基因編輯過程中存在效率不夠高、序列有偏好性以及潛在的脫靶風(fēng)險(xiǎn)等問題。
“比如在實(shí)現(xiàn)字母C-T的轉(zhuǎn)變過程中,如果C的前面是G,C字母就很難被改變?!备卟氏寂e例,此外,這些脫氨酶在一些重要作物如大豆中效果較差,這也是長期影響作物堿基編輯育種的一個(gè)關(guān)鍵問題。
同時(shí),作為疾病治療、農(nóng)業(yè)育種以及科學(xué)研究的基礎(chǔ)性、戰(zhàn)略性工具,目前堿基編輯系統(tǒng)的底層專利由美國持有,我國亟需打破堿基編輯底層專利壟斷。
能否挖掘出新的脫氨酶,解決堿基編輯現(xiàn)有挑戰(zhàn),同時(shí)打破我國所面臨的底層專利困境?
2021年,在實(shí)驗(yàn)室的一次例行組會(huì)上,高彩霞與年輕的組員們就不同期刊的前沿進(jìn)展做分享交流時(shí),人工智能“明星”AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中的突出表現(xiàn)讓他們產(chǎn)生了一個(gè)想法:何不將它與現(xiàn)有堿基編輯技術(shù)結(jié)合起來看看會(huì)發(fā)生什么?
一直以來,科學(xué)家主要通過基因序列來定向改進(jìn)現(xiàn)有脫氨酶?!懊摪泵傅慕Y(jié)構(gòu)與其功能存在緊密關(guān)聯(lián),這意味著科學(xué)家需要花費(fèi)大量的時(shí)間用實(shí)驗(yàn)解析相關(guān)的序列從而拿到一個(gè)蛋白的結(jié)構(gòu)。所以我們就想能不能通過人工智能找一些跟現(xiàn)有脫氨酶在結(jié)構(gòu)上相似度更高的蛋白。”高彩霞研究組博士生費(fèi)宏源對(duì)《中國科學(xué)報(bào)》說。
“比如AlphaFold2讓我們一天就能高通量地構(gòu)建300多個(gè)蛋白的結(jié)構(gòu),是傳統(tǒng)方法的很多倍。”費(fèi)宏源補(bǔ)充說,經(jīng)過一段時(shí)間的摸索,聚焦生物信息學(xué)的她成為研究組的“人工智能擔(dān)當(dāng)”。
研究團(tuán)隊(duì)首先通過AlphaFold2對(duì)代表性的283個(gè)具有脫氨潛力的蛋白質(zhì)序列進(jìn)行了結(jié)構(gòu)預(yù)測(cè),進(jìn)一步創(chuàng)新性地基于蛋白質(zhì)結(jié)構(gòu)的多重比對(duì),拓展了脫氨酶家族基于結(jié)構(gòu)的系統(tǒng)發(fā)育分析,將其劃分為20個(gè)潛在的蛋白質(zhì)家族。進(jìn)一步對(duì)每個(gè)家族中多個(gè)代表性成員進(jìn)行活性檢測(cè),他們發(fā)現(xiàn)其中6個(gè)家族具有活性,5個(gè)是全新的脫氨酶家族。
“現(xiàn)有rAPOBEC1脫氨酶家族成員都來自于真核生物(主要包括人、哺乳動(dòng)物或魚類)。我們的研究挖掘出一系列全新的脫氨酶,是目前唯一全部來自于原核生物(細(xì)菌)的脫氨酶?!备卟氏佳芯拷M博士后黃佳穎說,她參與了該研究的構(gòu)思與設(shè)計(jì)。
“小試牛刀”
基于蛋白結(jié)構(gòu)分類,研究者成功開發(fā)了一系列具有中國自主知識(shí)產(chǎn)權(quán)的堿基編輯新“利器”。
讓他們驚喜的是,在對(duì)具有活性的新脫氨酶家族進(jìn)行功能驗(yàn)證時(shí),他們發(fā)現(xiàn)此前被認(rèn)為具有雙鏈DNA脫氨功能的SCP1.201蛋白家族中的大部分蛋白其實(shí)只具有單鏈DNA脫氨的活性。這一顛覆性的認(rèn)知讓他們判斷:這個(gè)家族可能存在更精準(zhǔn)、高效的基因編輯工具。
他們對(duì)這個(gè)蛋白家族的所有成員一一進(jìn)行了分析,得到了一個(gè)“大禮包”。
研究者發(fā)現(xiàn),其中一些脫氨酶(如雙鏈堿基編輯系統(tǒng)中的Ddd9)可實(shí)現(xiàn)常規(guī)系統(tǒng)難以靶向的GC偏好堿基的編輯;一些脫氨酶(如單鏈堿基編輯系統(tǒng)中Sdd7和Sdd3)展現(xiàn)出非常高的編輯活性和明顯的GC序列偏好性;還有一些脫氨酶(Sdd6)在測(cè)試的位點(diǎn)中幾乎檢測(cè)不到脫靶事件。
他們還打造了這些堿基編輯工具的“迷你版”。“通過AI輔助截短原有蛋白,把它包裹在單個(gè)腺病毒中可以增強(qiáng)遞送的靈活性,同時(shí)保留它原有基因組編輯效率。”黃佳穎介紹。
他們同時(shí)在動(dòng)物和植物中對(duì)這些堿基編輯工具“小試牛刀”,發(fā)現(xiàn)“新工具包”在醫(yī)學(xué)和農(nóng)業(yè)領(lǐng)域展現(xiàn)出廣泛的使用潛力。其中,通過腺病毒轉(zhuǎn)染小鼠細(xì)胞,新型堿基編輯器可成功獲得高達(dá)43.1%的編輯效率,這說明基于新脫氨酶開發(fā)的堿基編輯藥物可以裝載到單個(gè)病毒顆粒并高效矯正遺傳病突變位點(diǎn),為基因治療提供了全新的技術(shù)方案。
更重要的是,研究者新開發(fā)的Sdd7-CBE系統(tǒng),克服了大豆中長期存在的堿基編輯效率低下的問題,他們?cè)?54株基因組編輯大豆中獲得了34株具有抗除草劑表型的穩(wěn)定編輯植株,相比之下,常規(guī)的基因組編輯技術(shù)獲得編輯植株的效率為零。
“這項(xiàng)研究展示了多個(gè)令人興奮的前景。”該文章的一位國際審稿人說,首先,研究利用AlphaFold2進(jìn)行的蛋白質(zhì)結(jié)構(gòu)分析是一種具有普適性的新概念和方法;其次,許多新的脫氨酶結(jié)構(gòu)域的鑒定為堿基編輯領(lǐng)域增加了有價(jià)值的工具;此外,堿基編輯技術(shù)在大豆植株中的應(yīng)用為該方法的有效性提供了有力的例證。
“從源頭上探索自己的工具”
“這項(xiàng)研究太漂亮了!是一個(gè)非常完美的工作!”新成果發(fā)表后,領(lǐng)域內(nèi)的老朋友、美國科學(xué)院院士Dan Voytas通過郵件向高彩霞道賀。
對(duì)此,高彩霞表示:“當(dāng)前越來越多的研究成果都是相互站在巨人肩膀上,才能實(shí)現(xiàn)“1+1>2的效果。這項(xiàng)研究也不例外。”
據(jù)介紹,這些全新工具已申請(qǐng)相關(guān)發(fā)明專利。高彩霞希望能夠從源頭上探索自己的基因組編輯工具,夯實(shí)我國基因組編輯生物育種的技術(shù)專利池。
“目前,基因組編輯技術(shù)已經(jīng)發(fā)展到3.0時(shí)代,其中最關(guān)鍵的問題就是解決大片段編輯的‘短板’,實(shí)現(xiàn)Kb(千字節(jié))級(jí)的大片段DNA甚至是染色體水平的精準(zhǔn)編輯?!备卟氏颊f。
今年4月,高彩霞和團(tuán)隊(duì)將引導(dǎo)編輯和位點(diǎn)特異性重組酶結(jié)合開發(fā)了PrimeRoot系統(tǒng),在水稻和玉米中實(shí)現(xiàn)了長達(dá)11.1 Kb的大片段DNA的高效精準(zhǔn)定點(diǎn)插入,相關(guān)成果發(fā)表于《自然—生物技術(shù)》。這一成果表明高彩霞團(tuán)隊(duì)在全球率先邁入基因組編輯3.0時(shí)代的門檻,為植物分子育種提供了更為有力的技術(shù)支撐。
科學(xué)無極限。為讓基因組編輯這把改造遺傳密碼的利器更加得心應(yīng)手,他們?nèi)栽诶^續(xù)探索。
相關(guān)論文信息:
DOI:10.1016/j.cell.2023.05.041
標(biāo)簽: