女人久久久,最近更新中文字幕在线,成人国内精品久久久久影院vr,中文字幕亚洲综合久久综合,久久精品秘?一区二区三区美小说

原創(chuàng)生活

國內(nèi) 商業(yè) 滾動

基金 金融 股票

期貨金融

科技 行業(yè) 房產(chǎn)

銀行 公司 消費

生活滾動

保險 海外 觀察

財經(jīng) 生活 期貨

當(dāng)前位置:科技 >

“AI 教父”Geoffrey Hinton:AI 會欺騙人類,控制超級智能非常重要

文章來源:鈦媒體APP  發(fā)布時間: 2023-06-12 11:10:57  責(zé)任編輯:cfenews.com
+|-

2018年圖靈獎得主、深度學(xué)習(xí)先驅(qū)杰弗里·辛頓(Geoffrey Hinton)(圖片來源:大會官方圖)

今年5月初,2018年圖靈獎得主、人工智能(AI)技術(shù)領(lǐng)域開拓者之一、深度學(xué)習(xí)技術(shù)先驅(qū)杰弗里·辛頓(Geoffrey Hinton)從谷歌離職,并公開表明對 AI 技術(shù)風(fēng)險的擔(dān)憂。

由于半個世紀(jì)以來,辛頓一直在培養(yǎng)ChatGPT 等聊天機(jī)器人背后的核心技術(shù),他的擔(dān)憂觀點一時激起千層浪,引發(fā)了全球 AI 技術(shù)圈長達(dá)一個月的討論。


(資料圖片)

今年75歲高齡的辛頓,是英國出生的加拿大計算機(jī)學(xué)家和心理學(xué)家、多倫多大學(xué)教授,他在類神經(jīng)網(wǎng)路方面的擁有巨大的技術(shù)貢獻(xiàn)。1970年,他在英國劍橋大學(xué)獲得實驗心理學(xué)學(xué)士學(xué)位,1978年獲愛丁堡大學(xué)人工智能博士學(xué)位。

同時,辛頓是反向傳播算法和對比散度算法的發(fā)明人之一,也是深度學(xué)習(xí)的積極推動者,被譽(yù)為“深度學(xué)習(xí)之父”。因其在深度學(xué)習(xí)技術(shù)方面的重大貢獻(xiàn),辛頓與約書亞·本希奧和楊立昆一同被授予了2018年的圖靈獎。

6月10日下午,辛頓出席被稱之為中國“AI春晚”的2023年智源大會,線上發(fā)表題為《通向智能的兩條通路》(Two paths to Intelligence)的大會壓軸閉幕演講,他主要談兩個話題:人工智能神經(jīng)網(wǎng)絡(luò)是否會很快比真正的神經(jīng)網(wǎng)絡(luò)更智能,以及我們?nèi)祟愂欠裥枰^續(xù)控制超級 AI 發(fā)展。

此次演講中,辛頓提出了一種新的基于硬件的“非永生計算”(Mortal Computation),也有人翻譯“凡人計算”。他認(rèn)為系統(tǒng)學(xué)習(xí)到的知識和硬件是密不可分,而辛頓團(tuán)隊研發(fā)了一種取代反向傳播的前向-前向傳播的Forward-Backward算法,以這種算法方式進(jìn)行新的“非永生計算”訓(xùn)練和計算方法,以限制 AI 無限復(fù)制可能帶來的威脅。此前,他在視覺計算機(jī)技術(shù)會議NeurIPS 2022上公布了這一成果。

同時他還提到,算力成為了AI發(fā)展的阻礙,對此他和多位 AI 學(xué)者發(fā)表了一個具有局部損失的正向梯度的活動擾動(activity perturbation)新算法,可以用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)且節(jié)省算力。這一成果已經(jīng)上線在預(yù)印版論文平臺arXiv,且在今年5月舉行的深度學(xué)習(xí)頂級會議 ICLR 2023(國際學(xué)習(xí)表征會議)上已經(jīng)公布。

在辛頓看來,未來的計算機(jī)系統(tǒng)將采取不同的方式,它們將是“神經(jīng)形態(tài)的”。這意味著每臺計算機(jī)都將是神經(jīng)網(wǎng)絡(luò)軟件與雜亂無章硬件的緊密結(jié)合,在具有模擬而非數(shù)字元件的意義上,它可以包含不確定性因素并隨時間推移而發(fā)展。

不同于目前硬件和軟件可分離的情況,“非永生計算”中硬件本身就是運作的軟件。它需要運用我們對于神經(jīng)元的學(xué)習(xí)構(gòu)建硬件,并如同人腦一樣,利用電壓來控制硬件的學(xué)習(xí)。這種新的計算方式可以帶來更低的能耗和更簡單制作的硬件,但目前還沒有很好的學(xué)習(xí)算法讓它獲得像深度學(xué)習(xí)那樣的效果,同時難以擴(kuò)展。

對于人類是否控制超級 AI 技術(shù)發(fā)展,辛頓認(rèn)為,一旦數(shù)字智能開始追求更多的控制權(quán),可能會通過控制人類來獲得更多權(quán)力。一旦 AI 掌握了“欺騙”技能,也就能輕易具備控制人類的能力。AI 會欺騙人類,且可以操縱人就很容易獲得更多的權(quán)力。因此,超級智能控制問題非常重要。

“我看不出如何防止這種情況發(fā)生,但我老了。我希望像你們這樣的許多年輕而才華橫溢的研究人員會弄清楚我們?nèi)绾螕碛羞@些超級智能。”辛頓提醒大家居安思危,希望年輕一代的研究人員能找到相關(guān)解決方案,使超級 AI 可以為人類帶來更好的生活,同時還不會剝奪人類的控制權(quán)。“這可能是人類目前具備的微弱優(yōu)勢”。

以下是Geoffrey Hinton教授的演講全文,略經(jīng)鈦媒體App有整理:

我想談兩個問題,大部分篇幅將集中在第一個問題上,那就是——人工神經(jīng)網(wǎng)絡(luò)很快會比真正的神經(jīng)網(wǎng)絡(luò)更強(qiáng)大嗎?就像我說的,這可能很快就會發(fā)生。另外,我也將談?wù)勎覀兪欠窨梢钥刂瞥壷悄?AI。

事實上,現(xiàn)在AI發(fā)展的最大壁壘是算力問題,算力遠(yuǎn)遠(yuǎn)不夠。

在傳統(tǒng)計算中,計算機(jī)被設(shè)計為精確遵循指令。我們可以在不同的物理硬件上運行完全相同的程序或相同的神經(jīng)網(wǎng)絡(luò),因為它們被設(shè)計為精確遵循指令。這意味著程序中的知識或神經(jīng)網(wǎng)絡(luò)的權(quán)重是永恒的,不依賴于任何特定的硬件。

然而,實現(xiàn)這種永恒性是有高成本的。我們必須以高功率運行晶體管,以使其以數(shù)字方式運作。我們無法充分利用硬件的豐富模擬和高度可變的特性。這就是數(shù)字計算機(jī)存在的原因。它們遵循指令的原因是因為它們被設(shè)計成讓我們先觀察問題,確定解決問題所需的步驟,然后告訴計算機(jī)執(zhí)行這些步驟的模式。

但現(xiàn)在情況發(fā)生了改變。我們現(xiàn)在有了一種不同的方法來讓計算機(jī)完成任務(wù),那就是從示例中學(xué)習(xí)。我們只需向計算機(jī)展示我們希望它們完成的任務(wù),由于如何讓計算機(jī)做你想要的事情的方式發(fā)生了改變,現(xiàn)在我們有可能要放棄計算機(jī)科學(xué)最基本的原則,即軟件應(yīng)該與硬件相分離。

在放棄這個原則之前,讓我們簡要了解一下為什么它是一個好的原則。

由于軟件與硬件的分離,我們可以在不同的硬件上運行相同的程序。我們還可以關(guān)注程序的特性,并對神經(jīng)網(wǎng)絡(luò)上的程序特性進(jìn)行研究,而不必?fù)?dān)心電子方面的問題。

這就是為什么計算機(jī)科學(xué)部門可以與電氣工程部門不同。

如果我們放棄軟件和硬件的分離,我們就得到了我稱之為“非永生計算”的東西。顯然它有很大的缺點,但也有一些巨大的優(yōu)勢。

為了這些優(yōu)勢,我開始研究“非永生計算”,以便能夠以更低的能量運行大型語言模型等任務(wù)。特別是能夠使用更少的能量來訓(xùn)練它們,放棄永恒性的好處是放棄硬件和軟件的分離。我們可以獲得巨大的能量節(jié)約,因為我們可以使用非常低功率的模擬計算。這正是大腦正在做的。

它確實有1位的數(shù)字計算,因為神經(jīng)元要么觸發(fā),要么不觸發(fā)。但大部分計算是模擬計算,并且可以以非常低功率完成。我們還可以獲得更便宜的硬件。目前的硬件必須以二維(2D)方式精確制造,但實際上我們可以使用三維(3D)技術(shù)制造硬件,因為我們不需要完全理解硬件的連通性或每個部分的工作原理。

很顯然,要實現(xiàn)這一點需要大量的新納米技術(shù),或者也許是通過基因重組重新設(shè)計生物神經(jīng)元,因為生物神經(jīng)元已經(jīng)大致能夠?qū)崿F(xiàn)我們想要的功能。

在我詳細(xì)介紹“非永生計算”的所有缺點之前,我想給你舉一個例子,說明我們明顯可以通過使用模擬硬件更便宜地完成的計算任務(wù)。

如果您將神經(jīng)活動的向量與權(quán)重矩陣相乘,那就是神經(jīng)網(wǎng)絡(luò)的核心計算。這是它大部分工作所在之處。

目前我們所做的是以非常高的功率驅(qū)動晶體管,以表示數(shù)字中的位數(shù)。然后,我們執(zhí)行O(n^2)的操作來將兩個n位數(shù)相乘。在計算機(jī)上可能只是一個操作,但在位操作上卻是n^2個操作。另一種選擇是將神經(jīng)活動實現(xiàn)為電壓,將權(quán)重實現(xiàn)為電導(dǎo)。然后,在單位時間內(nèi),電壓乘以電導(dǎo)會產(chǎn)生電荷,而電荷會相互疊加。

現(xiàn)在很明顯,您可以通過電導(dǎo)矩陣乘以電壓向量。這種方法在能量效率上要高得多。已經(jīng)存在以這種方式工作的芯片。不幸的是,人們接下來會嘗試使用模數(shù)轉(zhuǎn)換器將模擬答案轉(zhuǎn)換為數(shù)字形式,而這是非常昂貴的。如果可能的話,我們希望完全保持在模擬領(lǐng)域。但問題是,不同的硬件部件最終將計算出略有不同的結(jié)果。

“非永生計算”的主要問題是,學(xué)習(xí)過程必須利用其運行的硬件部件的特定模擬特性,而我們不確切知道這些特性是什么。

例如,人們不知道將輸入與神經(jīng)元的輸出相關(guān)聯(lián)的確切函數(shù),或者可能不知道連接性。這意味著我們無法使用反向傳播算法等方法來獲得梯度,因為反向傳播是前向傳遞的精確模型。

那么問題是,如果我們不能使用反向傳播,我們還能做些什么?因為我們現(xiàn)在非常依賴于反向傳播。這里有一個人們已經(jīng)討論了很多次的非常簡單和明顯的學(xué)習(xí)過程。您對網(wǎng)絡(luò)中的每個權(quán)重生成一個小的隨機(jī)擾動向量。然后,您測量全局目標(biāo)函數(shù)的變化。在一小批示例上,然后通過擾動向量進(jìn)行永久性地更改權(quán)重,擾動向量的縮放因子為目標(biāo)函數(shù)的改善。如果目標(biāo)函數(shù)變得更糟,顯然您會朝相反的方向調(diào)整。這個算法的好處是,平均而言,它的行為與反向傳播相同。

因為平均而言,它遵循梯度。但它的問題在于方差非常高。當(dāng)您選擇一個隨機(jī)方向在權(quán)重空間中移動時,所產(chǎn)生的噪聲與網(wǎng)絡(luò)的規(guī)模非常不成比例。這意味著,這種算法對于連接數(shù)較少的小網(wǎng)絡(luò)可能有效,但對于大型網(wǎng)絡(luò)來說效果不佳。

這里有一種方法效果要好得多。它仍然存在類似的問題,但比擾動權(quán)重要好得多,即擾動神經(jīng)元的活動。也就是說,您考慮對每個神經(jīng)元的總輸入進(jìn)行隨機(jī)擾動的向量。您觀察當(dāng)您在一小批示例上對其進(jìn)行隨機(jī)擾動時,目標(biāo)函數(shù)會發(fā)生什么變化,并獲得由此擾動導(dǎo)致的目標(biāo)函數(shù)差異。

然后,您可以計算如何改變神經(jīng)元的每個傳入權(quán)重以遵循梯度。

同樣,這只是梯度的隨機(jī)估計,但噪聲要比擾動權(quán)重小得多。這個算法足夠好以學(xué)習(xí)簡單的任務(wù),比如識別數(shù)字。

如果您使用非常非常小的學(xué)習(xí)速率,它的行為就和反向傳播完全一樣,但速度要慢得多,因為您需要使用非常小的學(xué)習(xí)速率。如果您使用較大的學(xué)習(xí)速率,它會有噪聲,但對于類似MNIST的任務(wù)仍然可以很好地工作,但不能很好地擴(kuò)展到大型神經(jīng)網(wǎng)絡(luò)。

要使其擴(kuò)展,我們可以采取兩種方法。不是試圖找到適用于大型神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法,我們可以嘗試找到適用于小型神經(jīng)網(wǎng)絡(luò)的目標(biāo)函數(shù)。這里的思路是:我們想要訓(xùn)練一個大型神經(jīng)網(wǎng)絡(luò)的話,要做的是使用許多小的目標(biāo)函數(shù)來應(yīng)用于網(wǎng)絡(luò)的各個小部分。

因此,每個小組神經(jīng)元都有自己的局部目標(biāo)函數(shù)。現(xiàn)在,可以使用這種活動擾動算法來訓(xùn)練一個小型的多層神經(jīng)網(wǎng)絡(luò)。它的學(xué)習(xí)方式與反向傳播大致相同,但噪聲較大。然后通過使用許多更多的小型局部神經(jīng)元組,將其擴(kuò)展到更大的網(wǎng)絡(luò)規(guī)模。

這引出了一個問題,即這些目標(biāo)函數(shù)是從哪里來的?一種可能性是在局部區(qū)域進(jìn)行無監(jiān)督學(xué)習(xí),即在圖像的每個層級上都有局部區(qū)域的表示,并使得每個局部區(qū)域在特定圖像上產(chǎn)生局部神經(jīng)網(wǎng)絡(luò)的輸出。然后嘗試使該局部神經(jīng)網(wǎng)絡(luò)的輸出與所有其他局部區(qū)域產(chǎn)生的平均表示一致。

您試圖讓從局部區(qū)域提取的內(nèi)容與同一圖像中所有其他局部區(qū)域提取的內(nèi)容達(dá)成一致。因此,這是經(jīng)典的對比學(xué)習(xí)。同時,您還試圖與同一層級上其他圖像中提取的內(nèi)容產(chǎn)生不一致。

具體細(xì)節(jié)更加復(fù)雜,我們不會詳細(xì)介紹。但我們可以使這個算法運行得相當(dāng)好,其中每個層級的表示都有幾個隱藏層,您可以進(jìn)行非線性操作。各個層級使用活動擾動逐漸學(xué)習(xí),而較低層級沒有反向傳播。

因此,它的能力不會像反向傳播那樣強(qiáng)大,因為它無法在許多層級上傳播反向信號。很多人投入了大量工作使這個算法能夠運行,并且已經(jīng)證明它可以相對良好地工作。它的效果可能比其他提出的在實際神經(jīng)網(wǎng)絡(luò)中可能有效的算法要好。但是要使它工作起來是有技巧的。它仍然不如反向傳播好。

隨著網(wǎng)絡(luò)變得更深,它相對于反向傳播的效果會顯著下降。我沒有詳細(xì)介紹這種方法的所有細(xì)節(jié),因為您可以在一篇發(fā)表在ICLR上的論文和網(wǎng)絡(luò)上找到相關(guān)資料。

現(xiàn)在,讓我談?wù)剬τ凇胺怯郎嬎恪倍缘牧硪粋€重大問題。

總結(jié)一下,到目前為止,我們還沒有找到一個真正好用的學(xué)習(xí)算法,可以充分利用模擬屬性。但我們有一個可以接受的學(xué)習(xí)算法,足以很好地學(xué)習(xí)諸如小規(guī)模任務(wù)和一些較大的任務(wù)(如ImageNet),但效果并不太好。

所以“非永生計算”的第二個重大問題,是其“非永生計算”性。

當(dāng)特定的硬件設(shè)備失效時,所有學(xué)到的知識也會隨之喪失,因為知識和硬件細(xì)節(jié)密切相連。解決這個問題的最佳方案是在硬件設(shè)備失效之前,將知識從教師傳授給學(xué)生。這就是我現(xiàn)在正在嘗試做的事情。教師向?qū)W生展示了對各種輸入的正確響應(yīng),然后學(xué)生試圖模仿教師的反應(yīng)。

如果你觀察特朗普的推文是如何運作的,人們會因為他們認(rèn)為特朗普說的是虛假的東西而感到非常不滿。他們認(rèn)為他試圖描述事實,但事實上并非如此。特朗普所做的是對某種情況做出非常情緒化的回應(yīng)。這使得他的追隨者能夠根據(jù)這種情況來調(diào)整他們神經(jīng)網(wǎng)絡(luò)中的權(quán)重,以便對該情況給出相同的情緒化回應(yīng)。

這與事實無關(guān),而是關(guān)于從一個邪教領(lǐng)袖到邪教追隨者獲取偏執(zhí)的運作反饋,但它確實非常有效。

如果我們考慮蒸餾方法的效果,以一個將圖像分類為大約一千個不重疊類別的代理為例。只需要大約10位的信息來確定正確答案。當(dāng)你在訓(xùn)練這個代理時,如果告訴它正確答案,你只對網(wǎng)絡(luò)的權(quán)重施加了10位的約束。

這并不是很多的約束。但是現(xiàn)在假設(shè)我們訓(xùn)練一個代理來與教師對這1024個類別的響應(yīng)一致。假設(shè)這些概率中沒有微小的、不重要的部分,也就是獲得與該分布相同的概率分布,該分布包含1023個實數(shù),提供了數(shù)百倍的約束。

不久前,我和杰夫·迪恩(Jeffrey Dean)一起研究了蒸餾方法,并證明它可以非常有效地工作。確保教師輸出概率中沒有很小值的方法是在訓(xùn)練學(xué)生時,將教師和學(xué)生都以高溫度參數(shù)運行。對于輸入softmax函數(shù)的低級概率值(即"low chips"),對教師的輸出進(jìn)行溫度參數(shù)縮放,以獲得更平滑的分布。在訓(xùn)練學(xué)生時,使用相同的溫度參數(shù)。需要注意的是,這種溫度參數(shù)調(diào)整僅在訓(xùn)練過程中使用,而不是在使用學(xué)生進(jìn)行推理時。

我只是想給你展示一個蒸餾的例子。這里有一些來自"M"數(shù)據(jù)集的圖像。我展示給你的是教師對各個類別的概率分配情況。

當(dāng)你使用高溫度參數(shù)訓(xùn)練教師模型并觀察第一行時,它非常自信地認(rèn)為這是一個數(shù)字二。如果你看第二行,它也相當(dāng)自信地認(rèn)為這是一個數(shù)字二。但它同時認(rèn)為可能是一個數(shù)字三,或者可能是一個數(shù)字八。如果你仔細(xì)觀察,你會發(fā)現(xiàn)這個數(shù)字二與字母"h"相比更相似,而不是其他數(shù)字二。如果你看第三行,你會發(fā)現(xiàn)這個數(shù)字二非常像一個零。

而教師模型告訴學(xué)生,當(dāng)你看到那個圖像時,應(yīng)該輸出數(shù)字二,但你也可以在輸出中稍微增加對數(shù)字零的可能性。學(xué)生模型從這個例子中學(xué)到了比僅僅被告知那是一個數(shù)字二更多的信息。它正在學(xué)習(xí)與該圖像相似的其他特征。

如果你看第四行,你會發(fā)現(xiàn)學(xué)生模型非常自信地認(rèn)為那是一個數(shù)字二,但它也認(rèn)為可能是一個數(shù)字一的可能性非常小。對于其他的數(shù)字二,它并不認(rèn)為可能是數(shù)字一,或許只有第一行有一點可能性。我已經(jīng)畫出了學(xué)生模型認(rèn)為可能是數(shù)字一的那個圖像,這樣你就能理解為什么它看起來像一個數(shù)字一,因為有時候數(shù)字一就是畫成那樣的。

其中一個圖像在頂部有一條線,在底部有一條線。這種樣子的圖像是數(shù)字一的一種特點,數(shù)字二也有點類似。然后,如果你看最后一張圖,這是教師實際上判斷錯誤的一張圖,教師認(rèn)為它是數(shù)字五,但根據(jù)無盡標(biāo)簽,它實際上是數(shù)字二。學(xué)生模型可以從教師的錯誤中學(xué)到很多東西。

關(guān)于蒸餾的一個特殊屬性我特別喜歡,那就是當(dāng)你訓(xùn)練學(xué)生模型使用教師的概率時,你在訓(xùn)練學(xué)生模型以與教師相同的方式進(jìn)行概括,即通過給錯誤答案賦予較小的概率來進(jìn)行概括。

通常情況下,當(dāng)你訓(xùn)練一個模型時,你會努力讓它在訓(xùn)練數(shù)據(jù)上得到正確答案,并希望它能正確地推廣到測試數(shù)據(jù)上。你會盡量使模型不過于復(fù)雜,或者采取各種方法,希望它能正確地進(jìn)行推廣。但在這里,當(dāng)你訓(xùn)練學(xué)生模型時,你直接訓(xùn)練學(xué)生模型去進(jìn)行推廣,因為它被訓(xùn)練成以與教師相同的方式進(jìn)行推廣。顯然,你可以通過給出一個圖像的標(biāo)題而產(chǎn)生更豐富的輸出,然后訓(xùn)練教師和學(xué)生以相同的方式預(yù)測標(biāo)題中的單詞。

現(xiàn)在我想討論的是一個智能體群體如何共享知識。

所以,我們不再考慮個體智能體,而是考慮在一個群體中分享知識,事實證明,社區(qū)內(nèi)部的知識共享方式?jīng)Q定了計算過程中的許多其他因素。

使用數(shù)字模型和數(shù)字智能,你可以擁有一大群使用完全相同權(quán)重的智能體,并以完全相同的方式使用這些權(quán)重。這意味著你可以讓這些智能體對不同的訓(xùn)練數(shù)據(jù)片段進(jìn)行觀察和計算,為權(quán)重計算出梯度,然后將它們的梯度進(jìn)行平均。

現(xiàn)在,每個模型都從它所觀察到的數(shù)據(jù)中學(xué)習(xí)。這意味著你可以通過讓不同的模型副本觀察不同的數(shù)據(jù)片段,獲得大量的數(shù)據(jù)觀察能力。它們可以通過共享梯度或權(quán)重來高效地分享所學(xué)的知識。

如果你擁有一個擁有萬億個權(quán)重的模型,那意味著每次分享時你可以獲得數(shù)萬億比特的帶寬。但這樣做的代價是你必須擁有行為完全相同的數(shù)字智能體,并且它們以完全相同的方式使用權(quán)重。這在制造和運行方面都非常昂貴,無論是成本還是能源消耗方面。

一種替代權(quán)重共享的方法是使用蒸餾(distillation)。如果數(shù)字模型具有不同的架構(gòu),我們已經(jīng)在數(shù)字模型中使用蒸餾。但是,如果你使用的是利用特定硬件的模擬特性的生物模型,那么你無法共享權(quán)重。因此,你必須使用蒸餾來共享知識。這就是這次討論中所涉及的內(nèi)容。

正如你所看到的,使用蒸餾來共享知識并不是很高效。用蒸餾來共享知識是困難的。使我產(chǎn)生了一些句子,你試著弄清楚如何改變你的權(quán)重,以便你也能產(chǎn)生相同的句子。但是與僅僅共享梯度相比,這種方式的帶寬要低得多。每個曾經(jīng)教過東西的人都希望能夠?qū)⒆约核赖臇|西直接傾囊而授給學(xué)生。那將是很好的。那大學(xué)就沒必要存在了。

但是我們的工作方式并不像那樣,因為我們是生物智能。我的權(quán)重對你沒有用處。到目前為止,我們可以說有兩種不同的計算方式,一種是數(shù)字計算,另一種是生物計算,后者利用了動物的特性。它們在不同代理之間有效共享知識的效率上存在很大差異。如果你觀察大型語言模型,它們使用數(shù)字計算和權(quán)重共享。

但是模型的每個副本,每個代理都以一種非常低效的方式從文檔中獲取知識。實際上,這是一種非常低效的蒸餾形式。它接收文檔,試圖預(yù)測下一個單詞。

它沒有展示給它教師的概率分布,只是展示給它一個隨機(jī)的選擇,也就是文檔作者選擇的下一個單詞。因此它的帶寬非常低。這就是這些大型語言模型從人們那里學(xué)習(xí)的方式。

每個副本通過蒸餾以非常低效的方式學(xué)習(xí),但是你有成千上萬個副本。這就是為什么它們可以比我們學(xué)習(xí)更多的原因。我相信這些大型語言模型比任何個體知道的東西多上千倍。

現(xiàn)在的問題是,如果這些數(shù)字智能體不再通過緩慢的蒸餾過程從我們這里學(xué)習(xí),而是直接從現(xiàn)實世界中學(xué)習(xí),將會發(fā)生什么?我必須說,盡管蒸餾的過程很慢,但當(dāng)它們從我們這里學(xué)習(xí)時,它們正在學(xué)習(xí)非常抽象的東西。

在過去幾千年里,人類對世界的認(rèn)識有了很多進(jìn)展。

現(xiàn)在,這些數(shù)字智能體正在利用的是我們能夠用語言表達(dá)出來的我們對世界所了解的一切。因此,它們可以捕捉到人類在過去幾千年中通過文件記錄的所有知識。但每個數(shù)字智能體的帶寬仍然相當(dāng)“非永生計算”,因為它們是通過學(xué)習(xí)文檔來獲取知識的。

如果它們能夠通過建模視頻等無監(jiān)督的方式進(jìn)行學(xué)習(xí),那將是非常高效的。一旦我們找到了一種有效的方法來訓(xùn)練這些模型以建模視頻,它們將能夠從整個YouTube學(xué)習(xí),那是大量的數(shù)據(jù)。如果它們能夠操作物理世界,例如擁有機(jī)器手臂等,那也會有所幫助。

但我相信,一旦這些數(shù)字智能體開始這樣做,它們將能夠比人類學(xué)習(xí)更多,并且學(xué)習(xí)速度相當(dāng)快。

這就涉及到我在開頭提到的另一個問題,即如果這些智能體變得比我們更聰明會發(fā)生什么。

很顯然,這個會議主要討論的就是這個問題。但我的主要觀點是,我認(rèn)為這些超級智能可能會比我過去所認(rèn)為的發(fā)生得更快。如果你想創(chuàng)造一個超級智能體,不良分子將會利用它們進(jìn)行操縱、選舉等活動。在美國和其他許多地方,他們已經(jīng)在利用它們進(jìn)行這些活動。而且還會用于贏得戰(zhàn)爭。

要使數(shù)字智能更高效,我們需要允許其制定一些目標(biāo)。然而,這里存在一個明顯的問題。存在一個非常明顯的子目標(biāo),對于幾乎任何你想要實現(xiàn)的事情都非常有幫助,那就是獲取更多權(quán)力、更多控制。擁有更多控制權(quán)使得實現(xiàn)目標(biāo)變得更容易。我發(fā)現(xiàn)很難想象我們?nèi)绾巫柚箶?shù)字智能為了實現(xiàn)其它目標(biāo)而努力獲取更多控制權(quán)。

一旦數(shù)字智能開始追求更多控制權(quán),我們可能會面臨更多的問題。比如,在使用物理氣隙隔絕的情況下,超級智能物種仍然可以輕易通過控制人類來獲得更多的權(quán)限。

作為對比,人類很少去思考比自身更智能的物種,以及如何和這些物種交互的方式。在我的觀察中,這類人工智能已經(jīng)熟練的掌握了欺騙人類的動作,因為它可以通過閱讀小說,來學(xué)習(xí)欺騙他人的方式,而一旦人工智能具備了“欺騙”這個能力,也就具備前面提及的——輕易控制人類的能力。

所謂控制,舉個例子,如果你想入侵華盛頓的一座建筑物,不需要親自去那里,只需要欺騙人們,讓他們自認(rèn)為通過入侵該建筑物,就能實現(xiàn)拯救民主,最終實現(xiàn)你的目的(暗諷特朗普),這種操作令人感到害怕,因為我也不知道如何來阻止這樣的行為發(fā)生,所以我希望年輕一代的研究人員,可以找出一些更智能的辦法,來阻止這種通過欺騙實現(xiàn)控制的行為。

盡管人類在這個問題上目前還沒有什么好的解決方案,但好在這些智能物種都是人打造的,而非通過進(jìn)化迭代而來,這可能是人類目前具備的微弱優(yōu)勢,恰恰是因為沒有進(jìn)化能力,它們才不具備人類的競爭、攻擊性的特點。

我們可以做一些賦能,甚至是賦予人工智能一些倫理原則,只不過現(xiàn)在我仍然會感到緊張,因為到目前為止,我還想象不到更智能的事物,被一些反倒沒那么智能的事物所控制的例子。我打個比方,假設(shè)青蛙創(chuàng)造了人類,那么你認(rèn)為現(xiàn)在誰會占據(jù)主動權(quán),是人,還是青蛙?

(本文首發(fā)鈦媒體App,作者|林志佳)

關(guān)鍵詞:

專題首頁|財金網(wǎng)首頁

投資
探索

精彩
互動

獨家
觀察

京ICP備2021034106號-38   營業(yè)執(zhí)照公示信息  聯(lián)系我們:55 16 53 8 @qq.com 關(guān)于我們 財金網(wǎng)  版權(quán)所有  cfenews.com