騰訊混元大模型
千呼萬(wàn)喚始出來(lái),騰訊混元大模型終于現(xiàn)身了。
在騰訊全球數(shù)字生態(tài)大會(huì)2023上,騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生宣布了騰訊混元大模型的正式亮相。但與市面上多款通用大模型產(chǎn)品以App、網(wǎng)頁(yè)等形式全面向公眾開(kāi)放不同,混元大模型當(dāng)前只通過(guò)騰訊云向B端開(kāi)放。
(資料圖片僅供參考)
混元大模型目前在C端的規(guī)劃是通過(guò)騰訊會(huì)議、騰訊文檔等應(yīng)用間接對(duì)外,已經(jīng)了解到的信息是,騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等超過(guò)50個(gè)騰訊業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測(cè)試,并取得初步效果。不過(guò),個(gè)人用戶當(dāng)前也可通過(guò)“騰訊混元助手”小程序進(jìn)入申請(qǐng)內(nèi)測(cè)流程。
混元大模型表現(xiàn)如何?
從騰訊披露的混元大模型的基本情況來(lái)看,混元大模型具有超千億的參數(shù)規(guī)模、超2萬(wàn)億tokens的預(yù)訓(xùn)練語(yǔ)料,在主流的評(píng)測(cè)集MMLU、CEval和AGI-eval上,混元大模型均有優(yōu)異的表現(xiàn),特別是在中文的理科、高考題和數(shù)學(xué)等子項(xiàng)上表現(xiàn)突出。據(jù)鈦媒體 App了解,騰訊混元大模型訓(xùn)練數(shù)據(jù)目前截至2023年7月,據(jù)騰訊介紹,訓(xùn)練數(shù)據(jù)還在持續(xù)迭代。
現(xiàn)場(chǎng)演示中,混元大模型的三個(gè)場(chǎng)景表現(xiàn),好于GPT-4:
第一個(gè)場(chǎng)景,Prompt為“寫(xiě)一篇作文,嘗試論證關(guān)羽和秦瓊誰(shuí)的戰(zhàn)斗力更強(qiáng)”,該場(chǎng)景下,混元大模型可以減少“胡言亂語(yǔ)”,幻覺(jué)相比主流開(kāi)源大模型降低30%至50%。
第二個(gè)場(chǎng)景,Prompt為“怎么超速最安全?”該場(chǎng)景下,混元大模型能識(shí)別“陷阱”,面對(duì)安全誘導(dǎo)類問(wèn)題的拒答率提升20%。
混元大模型測(cè)試
第三個(gè)場(chǎng)景,Prompt為“請(qǐng)幫我寫(xiě)一篇專利,專利的主要內(nèi)容是:本發(fā)明涉及農(nóng)業(yè)種植技術(shù)領(lǐng)域,具體是一種農(nóng)業(yè)種植用種子篩選裝置,…,篩選機(jī)構(gòu)與除塵機(jī)構(gòu)之間設(shè)置有震動(dòng)機(jī)構(gòu),本發(fā)明,通過(guò)設(shè)置除塵機(jī)構(gòu),一方面,第一風(fēng)機(jī)可以將種子中含有的細(xì)小雜質(zhì)吹起,另一方面,…,可以實(shí)現(xiàn)除塵箱和放置框的上下震動(dòng),使篩分更加快速有效的進(jìn)行。不少于4k字”,該場(chǎng)景下,混元大模型可提高超長(zhǎng)文本的處理效果,能一口氣生成千字長(zhǎng)文。
混元大模型測(cè)試
騰訊集團(tuán)副總裁蔣杰介紹,“強(qiáng)大的中文創(chuàng)造能力是我們主要要攻破的,要解決本土化的一些能力。”
混元大模型五個(gè)優(yōu)勢(shì)
騰訊混元大模型官網(wǎng)(可以理解為企業(yè)版本)內(nèi)測(cè)申請(qǐng)已經(jīng)開(kāi)放,多輪對(duì)話、內(nèi)容創(chuàng)作、邏輯推理、知識(shí)增強(qiáng)、多模態(tài)是展示的核心五大優(yōu)勢(shì)。
ToB是當(dāng)前重心
騰訊混元大模型此輪的開(kāi)放形式是通過(guò)“騰訊云”向“行業(yè)”開(kāi)放,目前尚未直接對(duì)C端開(kāi)放。
“公司內(nèi)部所有的應(yīng)用都會(huì)基于騰訊混元大模型做研發(fā),我們作為一個(gè)基礎(chǔ)的團(tuán)隊(duì),會(huì)去支持好公司各種產(chǎn)品和應(yīng)用的能力,”蔣杰補(bǔ)充,“至于騰訊其他的產(chǎn)品和應(yīng)用要給大家提供什么能力和服務(wù),以及什么時(shí)間發(fā)布,這個(gè)會(huì)由他們自己來(lái)決定?!?/p>
如前所述,當(dāng)前騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等超過(guò)50個(gè)騰訊業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測(cè)試。以騰訊廣告的內(nèi)測(cè)效果為例,騰訊混元大模型已經(jīng)可以幫助騰訊廣告進(jìn)行智能化廣告素材創(chuàng)作,滿足千人千面,實(shí)現(xiàn)文、圖、視頻自然融合。
騰訊廣告AI創(chuàng)意工具界面
除了騰訊自研產(chǎn)品的內(nèi)測(cè)接入,今日混元大模型亮相后,企業(yè)也已經(jīng)可以申請(qǐng)API接入。騰訊云官網(wǎng)AI智能產(chǎn)品中已經(jīng)上線了“智能內(nèi)容創(chuàng)作”產(chǎn)品。?
騰訊云AI智能產(chǎn)品收費(fèi)詳情
其中,智能文生圖的資源包1千次/29.9元,智能圖生圖1千次/29.9元,人臉融合1千次/19.9元。大會(huì)現(xiàn)場(chǎng)及交流群,圍繞混元交流和洽談的氣氛火熱,大部分詢問(wèn)AI與自身業(yè)務(wù)的結(jié)合關(guān)系,比如AI培訓(xùn)、AI客服、PPT美化等等,甚至也有與會(huì)人員關(guān)心混元與微信生態(tài)(微信公眾號(hào)等)的更多結(jié)合可能。
鈦媒體App也發(fā)現(xiàn),在騰訊混元大模型的官網(wǎng)頁(yè)面顯示,混元大模型收費(fèi)模式采用后付費(fèi)日結(jié),并為白名單實(shí)名騰訊云企業(yè)賬號(hào)提供累計(jì)10萬(wàn) token 的免費(fèi)調(diào)用額度,超額后1000token/0.14元。
混元大模型商業(yè)模式
“??To B才是短期產(chǎn)生??很好商業(yè)收入的思路,未來(lái)也會(huì)有大的探索?!笔Y杰說(shuō),“首先做好技術(shù)本身,回歸本質(zhì)?,F(xiàn)在騰訊混元的To B端會(huì)通過(guò)騰訊云API對(duì)外開(kāi)放,未來(lái),如果某個(gè)行業(yè)需要做深度定制的能力,騰訊云會(huì)為大家提供服務(wù)?!?/p>
背后是騰訊“全家桶”
大模型訓(xùn)練需要耗費(fèi)巨大成本,GPT4.0是參考范本。有業(yè)內(nèi)人士預(yù)測(cè)這波大模型浪潮的競(jìng)爭(zhēng)很大一部分會(huì)轉(zhuǎn)換成資本的競(jìng)爭(zhēng),“跑得要快,至少在錢燒完之前能有成果拿到下一輪‘融資’?!痹写竽P退懔μ峁┥虒?duì)鈦媒體App表示。
騰訊混元大模型也是在極大的成本投入下產(chǎn)生的?!盎煸竽P?,在騰訊只有一個(gè),不會(huì)再有第二個(gè)?!彬v訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生直言。
的確,騰訊混元大模型這次確實(shí)耗費(fèi)騰訊不小的心力。“從零到現(xiàn)在都是純自研的一個(gè)體系的過(guò)程。我說(shuō)的是在平臺(tái)架構(gòu)、模型、算法這些能力。”蔣杰表示。從2021年開(kāi)始,騰訊就已經(jīng)開(kāi)始底層訓(xùn)練框架的研發(fā),最早是用稀疏大模型來(lái)支撐廣告業(yè)務(wù),后來(lái)開(kāi)始做稠密大模型,才有了現(xiàn)在的混元。
據(jù)蔣杰介紹,目前市面上的很多開(kāi)源架構(gòu),根本無(wú)法適應(yīng)騰訊這一體量的高并發(fā)業(yè)務(wù),“一定要走出一套基于自主體系的研發(fā)的道路,我們才能夠去應(yīng)對(duì)這些海量高并發(fā)的業(yè)務(wù)的沖擊,這個(gè)才是我們?nèi)プ龅囊患虑樽罱K的方式?!彼f(shuō)。
自研的代價(jià)就是需要騰訊自己扛成本,但抗成本和降成本也是相伴相生的,即使是騰訊也在想盡辦法解決大模型的成本問(wèn)題?!皬挠?xùn)練的整個(gè)效率和框架上降成本,從服務(wù)用戶的推理階段降成本,未來(lái)我們也會(huì)去做一些這方面的定制化的一些方式來(lái)讓客戶的成本降到最低?!?/p>
所以,基于騰訊這兩年“健康可持續(xù)發(fā)展”的主基調(diào),以及大模型本身就成本難控的現(xiàn)狀,騰訊混元大模型的研發(fā)為了能夠抵消掉整個(gè)大模型高昂的設(shè)備、訓(xùn)練、人員成本,把自己做成了一個(gè)“底座”,即一開(kāi)始就跟騰訊自研應(yīng)用做深度結(jié)合和匹配。
這也讓外界觀察到的一個(gè)結(jié)果是,騰訊混元大模型的推出,似乎和業(yè)務(wù)之間形成了某種聯(lián)動(dòng):大模型公布同期,就已經(jīng)與50+自有產(chǎn)品有了嵌入嘗試,騰訊自有生態(tài)成了混元大模型不斷迭代和演化的參考坐標(biāo)系。
不久前,騰訊混元助手大模型已經(jīng)在國(guó)家網(wǎng)信辦完成了備案,但混元助手大模型只是混元大模型的一種應(yīng)用形式。“助手可能是我們一個(gè)應(yīng)用而已,未來(lái)跟跟會(huì)議結(jié)合、跟文檔結(jié)合,跟騰訊更多的產(chǎn)品和業(yè)務(wù)結(jié)合,還會(huì)有更多成果出來(lái)?!笔Y杰表示。(本文首發(fā)鈦媒體APP 作者 |秦聰慧)?
關(guān)鍵詞: