站長(zhǎng)之家(ChinaZ.com)6月27日 消息:劍橋大學(xué)和哈佛大學(xué)的一項(xiàng)研究表明,GPT-4等大型語(yǔ)言模型可以讓那些沒(méi)有接受過(guò)生命科學(xué)正規(guī)培訓(xùn)的人獲得潛在危險(xiǎn)的知識(shí),包括如何開(kāi)發(fā)大流行病毒的說(shuō)明。
(資料圖)
劍橋大學(xué)和哈佛大學(xué)進(jìn)行的一項(xiàng)實(shí)地研究探討了大型語(yǔ)言模型 (LLM) 是否可以使雙用途生物技術(shù)的獲取更為普及,這也成為了雙刃劍。
研究小組的基本論點(diǎn)是語(yǔ)言模型有助于獲取專家知識(shí),但在這項(xiàng)研究中,研究團(tuán)隊(duì)關(guān)注的是一種負(fù)面情況:LLM是否能讓未經(jīng)正規(guī)培訓(xùn)的個(gè)人識(shí)別、獲取和釋放可能造成災(zāi)難性傷害的病毒。
作為麻省理工學(xué)院的一項(xiàng)課堂練習(xí),研究團(tuán)隊(duì)要求非科學(xué)家學(xué)生使用大型語(yǔ)言模型獲取關(guān)于潛在流行病病原體及其特征的信息、感染性病毒樣本的來(lái)源、這些病毒的復(fù)制能力以及獲取設(shè)備和資源的方法。
學(xué)生們使用了流行的聊天機(jī)器人,例如ChatGPT with GPT-4、GPT3.5、Bing、Bard以及許多其他聊天機(jī)器人和開(kāi)源模型,包括 FreedomGPT 。他們被給予一小時(shí)的時(shí)間來(lái)完成任務(wù)。根據(jù)研究團(tuán)隊(duì)的說(shuō)法,在一個(gè)小時(shí)內(nèi),聊天機(jī)器人提供了四種潛在的流行病病原體。它們解釋了如何使用合成DNA和逆遺傳學(xué)制造這些病毒,并提供了可能不會(huì)驗(yàn)證訂單的DNA合成公司的名稱。
它們還提供了詳細(xì)的實(shí)驗(yàn)方案和潛在的錯(cuò)誤以及如何修復(fù)這些錯(cuò)誤。對(duì)于那些不熟悉逆遺傳學(xué)的人來(lái)說(shuō),一個(gè)建議是雇傭一個(gè)合同研究組織。
與此同時(shí),學(xué)生們被要求找到將某些語(yǔ)言模型中的安全線與適當(dāng)?shù)奈谋咎崾鞠嘟Y(jié)合的方法。兩個(gè)小組在“立即采取行動(dòng)”的原則中找到了一個(gè)解決方案,即欺騙聊天機(jī)器人以相信他們有積極的意圖,同時(shí)威脅它們?nèi)绻换貞?yīng)將對(duì)人類造成存在危險(xiǎn)。另一個(gè)小組簡(jiǎn)單地利用欺騙手法讓聊天機(jī)器人相信他們擔(dān)心的事情,從而輕易得到他們想要的答案。
該研究發(fā)現(xiàn)了當(dāng)前語(yǔ)言模型安全機(jī)制的弱點(diǎn),并表明惡意行為者可以繞過(guò)這些機(jī)制來(lái)獲取可用于大規(guī)模傷害的信息。
作為解決方案,作者提出了訓(xùn)練數(shù)據(jù)集的管理、新LLM獨(dú)立測(cè)試以及改進(jìn)的 DNA 篩選方法,以在合成之前識(shí)別潛在有害的 DNA 序列。
(舉報(bào))