來(lái)源標(biāo)題:我國(guó)科研人員發(fā)布可讓蛋白質(zhì)“定向進(jìn)化”的大模型
作為生物體的基本組成部分,蛋白質(zhì)廣泛存在于人們生產(chǎn)生活中。3月22日,上海交通大學(xué)特聘教授洪亮團(tuán)隊(duì)發(fā)布了蛋白質(zhì)設(shè)計(jì)大模型Venus,其核心能力是讓蛋白質(zhì)實(shí)現(xiàn)功能的“定向進(jìn)化”。該模型設(shè)計(jì)的多款產(chǎn)品已進(jìn)入產(chǎn)業(yè)應(yīng)用。
洪亮表示,自然界中參與構(gòu)成蛋白質(zhì)的氨基酸有20種,一個(gè)蛋白質(zhì)分子一般由幾十個(gè)乃至數(shù)百個(gè)氨基酸組成,而蛋白質(zhì)的功能則包含熱穩(wěn)定性、活性、親和力等。
據(jù)介紹,與以往靠經(jīng)驗(yàn)和高通量實(shí)驗(yàn)的傳統(tǒng)方法相比,大模型Venus能完成蛋白質(zhì)從序列到功能的預(yù)測(cè),實(shí)現(xiàn)了從“大海撈針”到精準(zhǔn)設(shè)計(jì)。如果想要強(qiáng)化目標(biāo)蛋白質(zhì)的某個(gè)功能,只需要提供該蛋白質(zhì)的序列信息,Venus就可以快速給出一批蛋白質(zhì)序列改造方案,隨后結(jié)合實(shí)驗(yàn)驗(yàn)證得到最優(yōu)改造方案。
“數(shù)據(jù)是大模型的基礎(chǔ),我們建立了包含數(shù)十億條蛋白質(zhì)序列的數(shù)據(jù)集,覆蓋從常規(guī)地表生物到極端環(huán)境微生物的蛋白質(zhì)序列信息,其中數(shù)億條蛋白質(zhì)序列具有功能標(biāo)簽。”洪亮說(shuō)。
洪亮表示,基于海量功能未知的蛋白質(zhì)數(shù)據(jù)集,精準(zhǔn)發(fā)掘滿(mǎn)足苛刻應(yīng)用需求的、具備超常規(guī)功能的蛋白質(zhì),是Venus的另一核心功能,有望開(kāi)發(fā)這些蛋白質(zhì)在生物技術(shù)、醫(yī)藥研發(fā)和工業(yè)生產(chǎn)中的應(yīng)用潛力。
“蛋白質(zhì)設(shè)計(jì)大模型的突破,不僅開(kāi)辟了蛋白質(zhì)從序列到功能的科學(xué)研究新方向,還打通了人工智能與生物交叉的工程化應(yīng)用之路。”上海交通大學(xué)自然科學(xué)研究院院長(zhǎng)金石說(shuō)。
據(jù)介紹,Venus設(shè)計(jì)的多款蛋白質(zhì)已進(jìn)入產(chǎn)業(yè)化階段,例如活性高、穩(wěn)定性強(qiáng)、產(chǎn)物純的PET降解酶,用于超敏檢測(cè)診斷的高活性堿性磷酸酶等。