2 月初,隨著 ChatGPT 和微軟 Bing AI 接連引爆互聯(lián)網(wǎng),ChatGPT 概念股應(yīng)聲而起,其中知乎因?yàn)榇罅繂?wèn)答被廣泛地用于生成式 AI 的訓(xùn)練,股價(jià)一度暴漲 31%,之后百度文心一言發(fā)布時(shí)又漲了一大波。
但到了 4 月,一位網(wǎng)友就在知名程序員社區(qū) V2ex 發(fā)帖感慨:「ChatGPT 會(huì)是知乎最大的敵人?!?/strong>
不僅是他,很多人都發(fā)現(xiàn)知乎已經(jīng)充斥了大量 AI 生成的回答,有些可能是無(wú)關(guān)痛癢的觀點(diǎn),但不少也出現(xiàn)了「一本正經(jīng)胡說(shuō)八道」。與此同時(shí),AI 生成內(nèi)容也在一步一步擴(kuò)大自己的「領(lǐng)土」,從互聯(lián)網(wǎng)延伸真實(shí)世界。
(資料圖片)
海外技術(shù)社區(qū) Hacker News 上有人指出,一家網(wǎng)紅營(yíng)銷機(jī)構(gòu)網(wǎng)站上的一篇博文出現(xiàn)了「抱歉,作為一種 AI 語(yǔ)言模型,我無(wú)法預(yù)測(cè)未來(lái)的事件或趨勢(shì)」的提醒,類似的話語(yǔ)還出現(xiàn)在卡塔爾的購(gòu)物中心目錄和芬蘭的一家電子產(chǎn)品商店的網(wǎng)站等地方。
更多 AI 生成的虛假內(nèi)容,或許還沒(méi)有被發(fā)現(xiàn)。
沒(méi)人想要一個(gè)虛假的世界
圖/AI生成
很多人可能還記得,今年 3 月網(wǎng)上流傳出一系列「特朗普被捕」的照片,雖然后續(xù)大量報(bào)道都指出其為 AI 生成的虛假照片,但照片剛開始被熱傳時(shí),國(guó)內(nèi)外社交平臺(tái)上都有不少人信以為真。而后來(lái)出現(xiàn)的「甘肅火車事故」「八角大樓被襲」假新聞,也一次又一次挑起了人們的神經(jīng)。
過(guò)去半年我們已經(jīng)知道,ChatGPT 等生成式 AI 會(huì)不顧真假,生成海量似是而非的內(nèi)容。而由 AI 生成的虛假內(nèi)容又會(huì)被其他 AI 拿來(lái)學(xué)習(xí)后,再生成更加以假亂真的內(nèi)容。甚至,AI 還可以根據(jù)用戶的個(gè)人喜好一對(duì)一地生成虛假信息。因?yàn)?AI 可以擴(kuò)大和再生產(chǎn)假新聞,未來(lái)可能造成更加嚴(yán)重的輿論造假。
更大的問(wèn)題是,如果未來(lái)互聯(lián)網(wǎng)甚至是真實(shí)世界都充斥著各種 AI 生成的虛假內(nèi)容,一切都會(huì)崩潰。而從文字到圖片再到聲音,今天 AI 生成的內(nèi)容與真人創(chuàng)作的內(nèi)容之間變得越來(lái)越難以分辨,就像大部分人已經(jīng)無(wú)法分辨 AI 孫燕姿、AI Drake 與真人聲音。
同時(shí) AI 的進(jìn)化速度也太快了。幾個(gè)月前我們可能還在說(shuō) AI 繪畫「不會(huì)畫手」,但等到 Midjourney V5 新版本推出之后,AI 不僅在「畫手」上越發(fā)嫻熟,各種細(xì)節(jié)也變得更逼真。在針對(duì) AI 歌手的回應(yīng)中,孫燕姿也看到了這一點(diǎn):
「你可能會(huì)反對(duì),說(shuō)我還是能分辨出區(qū)別的,它沒(méi)有情緒,沒(méi)有音調(diào)和呼吸的變化。很抱歉,我懷疑這只是一個(gè)非常短期內(nèi)的回應(yīng)?!?/strong>
圖/孫燕姿
所以問(wèn)題已經(jīng)不在于我們能不能分辨 AI 生成的內(nèi)容,而是我們應(yīng)該如何辨認(rèn)出 AI 生成的內(nèi)容。
用「魔法」打敗「魔法」?
人工識(shí)別首先就不現(xiàn)實(shí),先不說(shuō)人工分辨 AI 生成內(nèi)容的準(zhǔn)確性,我們還需要投入海量的人力。
去年年底 ChatGPT 發(fā)布之后,很多人就用它來(lái)生成論文,并取得了很好的成績(jī),同時(shí)也吸引了更多的學(xué)生效仿。隨后,巴黎政治學(xué)院在內(nèi)的一些全球知名學(xué)府紛紛出臺(tái)了 ChatGPT 禁令。但據(jù)在線課程供應(yīng)商 Study.com 此前發(fā)起的一項(xiàng)調(diào)查顯示,1000 名 18 歲以上的學(xué)生中,超過(guò) 89%的學(xué)生都在使用 ChatGPT 來(lái)完成家庭作業(yè)。
但這個(gè)問(wèn)題總要解決,而最好的辦法,可能還是用「魔法」打敗「魔法」?
眾所周知,一個(gè)社區(qū)的核心是用戶與用戶之間的交流,而 AI 生成的虛假內(nèi)容一旦泛濫很容易摧毀這種交流,這也是所有在線社區(qū)極力避免的。但方法呢?除了依靠個(gè)人去辨別,很多時(shí)候我們又必須依賴 AI,比如前文提到 V2ex,其站長(zhǎng)@Livid 為了分辨 AI 生成的灌水內(nèi)容,就會(huì)直接反過(guò)來(lái)詢問(wèn) AI「是否由 AI 生成」,以此作為是否封禁用戶的依據(jù)。
圖/V2ex
問(wèn)題是這種方法還是存在太多的不確定性。
就在 ChatGPT 剛推出的幾天后,OpenAI 宣布聯(lián)合哈佛大學(xué)等高校和機(jī)構(gòu)一起打造了 AI 檢測(cè)器——GPT-2 Output Detector(GPT-2 輸出檢測(cè)器)。顧名思義,GPT-2 Output Detector 是基于 GPT-2 模型微調(diào)輸出的工具,對(duì)基于 GPT-3.5 的 ChatGPT 實(shí)際效果并不好。
于是今年 2 月 1 日,OpenAI 轉(zhuǎn)頭又推出「AI 生成內(nèi)容識(shí)別器」,目的是識(shí)別文本由 AI 生成還是人類撰寫,本質(zhì)上是一個(gè)辨別真實(shí)內(nèi)容和 AI 生成內(nèi)容的分類器。不過(guò),OpenAI 在博客中指出,該識(shí)別器對(duì) AI 生成內(nèi)容的檢測(cè)成功率僅為 26%:
可能還不如網(wǎng)友瞎猜。
國(guó)內(nèi)也出現(xiàn)了類似的 AIGC-X。這是一款由人民網(wǎng)下屬傳播內(nèi)容認(rèn)知國(guó)家重點(diǎn)實(shí)驗(yàn)室、中國(guó)科學(xué)技術(shù)大學(xué)、合肥綜合性國(guó)家科學(xué)中心人工智能研究院聯(lián)合推出的 AI 生成內(nèi)容檢測(cè)工具,支持對(duì) AI 生成內(nèi)容和人工生成內(nèi)容的分辨。盡管有報(bào)道稱 AIGC-X 對(duì)中文文本檢測(cè)的準(zhǔn)確率超過(guò) 90%,但實(shí)測(cè)并不如意。
即便有這么多錯(cuò)誤,圖/AIGC-X,Bing
可以說(shuō)到目前為止,所有試圖用 AI 打敗 AI 的嘗試都沒(méi)有成功,本身這條路徑也存在不少爭(zhēng)議,有人就將其形容為新時(shí)代的「自相矛盾」——用最強(qiáng)的矛打最強(qiáng)的盾。
相比之下,「水印」成了越來(lái)越廣泛的選擇。5 月谷歌 I/O 大會(huì)上,谷歌率先宣布公司的每一張 AI 生成圖片都會(huì)內(nèi)嵌水印,水印無(wú)法肉眼識(shí)別,但可通過(guò)谷歌搜索引擎等軟件讀取并以標(biāo)簽顯示出來(lái),用以提醒用戶該圖片由 AI 生成。不久后,Shutterstock、Midjourney 等 AI 應(yīng)用也宣布將支持這種新的標(biāo)記方法。
但 AI 生成文字還在等待一個(gè)切實(shí)可行的方案。在 AI 生成內(nèi)容識(shí)別器失敗之后,OpenAI 也在考慮在生成的文本中加入數(shù)字水印,以降低模型被濫用帶來(lái)的負(fù)面影響。OpenAI 對(duì)齊團(tuán)隊(duì)(主要負(fù)責(zé)系統(tǒng)安全性)負(fù)責(zé)人 Jan Leike 表示,OpenAI 已經(jīng)探索在文本中加入水印。
不過(guò),OpenAI CEO Sam Altman 在接受采訪也提醒到,不存在一個(gè)完美的 AI 生成文字識(shí)別工具,原因是人們總會(huì)弄清楚他們要修改多少文字,還會(huì)出現(xiàn)修改輸出文本的其他工具。
之前在某個(gè)論壇上看到一個(gè)帖子,一位網(wǎng)友通過(guò)搜索引擎跳到知乎的一則回答,看到了一半才意識(shí)到這則回答大概是由 AI 生成,瞬間有種被喂 x 的感覺。
關(guān)鍵是如果主動(dòng)使用 ChatGPT 之類的生成式 AI,我們可能對(duì)它的真實(shí)性、胡說(shuō)八道都會(huì)有一定的預(yù)期,但顯然我們無(wú)法阻止其他人使用并發(fā)布 AI 生成的虛假內(nèi)容。打個(gè)比方,如果對(duì)歷史并不熟悉的人,在知乎上看到一則言之鑿鑿討論亞瑟王的回答,會(huì)不會(huì)誤認(rèn)為亞瑟王是真實(shí)存在的人物,甚至是一位女騎士(型月作品中的設(shè)定)。
但坦白講,除了很明顯的 AI 生成風(fēng)格,我們很難在熟知領(lǐng)域之外分辨內(nèi)容是否由 AI 生成,唯一能做的,可能就是更加審視我們所看到的內(nèi)容。
題圖來(lái)自《七宗罪》劇照
關(guān)鍵詞: