6月29日,美團(tuán)在港交所發(fā)布公告,宣布收購(gòu)?fù)趸畚膭?chuàng)辦的大模型公司“光年之外”,這也給AI大模型市場(chǎng)留下了猜測(cè)。不只在國(guó)內(nèi),ChatGPT的訪問(wèn)量在近期增速下滑,數(shù)據(jù)顯示,ChatGPT6月份的全球訪問(wèn)量環(huán)比降幅9.7%,獨(dú)立訪客數(shù)量環(huán)比下滑了5.7%。此外,用戶使用ChatGPT的時(shí)長(zhǎng)也在下降,5月份的每次訪問(wèn)時(shí)長(zhǎng)下降了8.5%,AIGC似乎迎來(lái)了冷靜期。
但另一方面,7月4日,李開(kāi)復(fù)親自籌組的大模型公司“零一造物”正式上線、百度開(kāi)發(fā)的大語(yǔ)言模型“文心一言”APP上架蘋(píng)果應(yīng)用市場(chǎng)、企查查發(fā)布商查大模型——“知彼阿爾法”......各家公司在大模型領(lǐng)域動(dòng)作頻頻,熱火朝天。
AI大模型的創(chuàng)業(yè)有多火?資本市場(chǎng)對(duì)于這一風(fēng)口的投資布局如何?如今的國(guó)產(chǎn)大模型表現(xiàn)如何?本期鈦媒體·鈦度圖聞試圖從數(shù)據(jù)層面梳理目前國(guó)產(chǎn)大模型的發(fā)展現(xiàn)狀。
【資料圖】
國(guó)內(nèi)AI大模型“神仙打架”,科技巨頭競(jìng)相出手
從今年3月開(kāi)始,國(guó)內(nèi)的AI大模型如雨后春筍般涌現(xiàn)?!吨袊?guó)人工智能大模型地圖研究報(bào)告》顯示,截至2023年5月底,國(guó)內(nèi)10億級(jí)參數(shù)規(guī)模以上基礎(chǔ)大模型至少已發(fā)布79個(gè)。
從全球來(lái)看,美國(guó)在大模型數(shù)量方面居全球之首,早在2020年,美國(guó)就已推出了15款大模型,其中包括GPT-3。而中國(guó)從2020年開(kāi)始,大模型也進(jìn)入高速發(fā)展階段,2021年推出了30款大模型,2022年推出了28款大模型,2023年前5個(gè)月推出了19款大模型,超過(guò)美國(guó)的18款大模型。如今,中美兩國(guó)大模型的數(shù)量占全球大模型數(shù)量的近90%,中國(guó)大模型數(shù)量已進(jìn)入第一梯隊(duì)。
國(guó)內(nèi)大模型賽道熱鬧非凡,涉足AI大模型賽道的“玩家”有以阿里、騰訊、百度等為代表的互聯(lián)網(wǎng)大廠,3月16日,百度領(lǐng)跑,推出中國(guó)版ChatGPT“文心一言”,隨后,阿里、華為、騰訊、360等大模型陸續(xù)浮出水面。
此外,還有以商湯科技、科大訊飛等為代表的AI科技公司和教育類企業(yè)孩子王、金融類企業(yè)同花順、房地產(chǎn)類企業(yè)我愛(ài)我家等為代表的各行業(yè)公司。另外,大模型在學(xué)術(shù)界也很火熱,早在今年2月,復(fù)旦大學(xué)就已發(fā)布國(guó)內(nèi)首個(gè)類ChatGPT模型MOSS。
值得注意的是,隨著ChatGPT的火爆,國(guó)內(nèi)還火速興起了AI大模型的創(chuàng)業(yè)風(fēng)潮,諸多科技大佬以及大廠高管等投身大模型,開(kāi)啟再創(chuàng)業(yè)。2023年2月,原美團(tuán)聯(lián)合創(chuàng)始人王慧文發(fā)布“AI英雄榜”,高調(diào)入局AI大模型;同樣高調(diào)入場(chǎng)的還有創(chuàng)新工場(chǎng)CEO李開(kāi)復(fù),3月19日,李開(kāi)復(fù)在朋友圈宣布成立Project AI 2.0公司,進(jìn)軍AI大模型;隨后,搜狗創(chuàng)始人王小川、前京東AI業(yè)務(wù)開(kāi)路人周伯文、出門問(wèn)問(wèn)CEO李志飛等也都加入了AI大模型創(chuàng)業(yè)熱潮。
除了這些科技大佬,很多互聯(lián)網(wǎng)大廠高管也加入競(jìng)爭(zhēng)。比如,快手前 AI核心人物李巖,成立了AI公司元石科技,進(jìn)行多模態(tài)大模型的研發(fā);李開(kāi)復(fù)的“關(guān)門弟子”、依圖科技10號(hào)員工周健成立了瀾碼科技,致力于重塑人機(jī)互動(dòng)的模型。如今,國(guó)內(nèi)AI大模型“神仙打架”,行業(yè)賽道十分熱鬧。
投資機(jī)構(gòu)出手謹(jǐn)慎,市場(chǎng)高薪招聘大模型領(lǐng)域人才
入局大模型,首先要備好錢,畢竟大模型創(chuàng)業(yè)公司發(fā)布一個(gè)較為成熟的模型,需要投入大語(yǔ)言模型基礎(chǔ)設(shè)施、訓(xùn)練和研發(fā)人才的成本。對(duì)于初創(chuàng)企業(yè)來(lái)說(shuō),融到錢才能活下去。
據(jù)鈦媒體·鈦度圖聞不完全統(tǒng)計(jì),截至2023年7月4日,今年獲得融資的AI大模型創(chuàng)業(yè)公司融資金額普遍在千萬(wàn)到數(shù)億元之間。其中,獲得融資金額最多的是大模型初創(chuàng)公司MiniMax,其在6月1日完成了超2.5億美元的新一輪融資,目前該公司估值超12億美元,被冠以“騰訊首次投資的創(chuàng)企”稱號(hào)。此外,剛剛被美團(tuán)收購(gòu)的光年之外在6月5日完成A輪2.3億美元融資,只不過(guò)在美團(tuán)出手收購(gòu)?fù)瓿珊?,此輪融資也已被悉數(shù)退回。值得一提的是,成立于2021年的西湖心辰分別在今年3月、4月接連完成了兩筆融資,融資速度很快。
而在AI大模型投資中,IDG資本、經(jīng)緯創(chuàng)投、真格基金等頭部VC的出手較少。據(jù)鈦媒體·鈦度圖聞不完全統(tǒng)計(jì),騰訊投資、創(chuàng)新工場(chǎng)、奇績(jī)創(chuàng)壇、紅杉中國(guó)是較活躍的投資機(jī)構(gòu),投資企業(yè)均達(dá)到3家,其次是BV百度風(fēng)投和智譜AI,投資企業(yè)分別為2家,大多數(shù)機(jī)構(gòu)投資的企業(yè)僅為1家,而一向活躍的高瓴創(chuàng)投、深創(chuàng)投沒(méi)有公開(kāi)數(shù)據(jù)顯示其進(jìn)行過(guò)AI大模型賽道的投資,可見(jiàn)投資人對(duì)大模型創(chuàng)業(yè)這一賽道出手較為謹(jǐn)慎。
除了融資以外,技術(shù)能力也是影響大模型競(jìng)爭(zhēng)的核心。大模型對(duì)于算法、算力和數(shù)據(jù)都有很高的要求,AI大模型需要高昂的訓(xùn)練費(fèi)用和研發(fā)投入,一些互聯(lián)網(wǎng)大廠和科技公司擁有更為深厚的資金和技術(shù)儲(chǔ)備。據(jù)鈦媒體·鈦度圖聞不完全統(tǒng)計(jì),2022年,華為在研發(fā)費(fèi)用上投入1615億元,成為研發(fā)投資資金最多的企業(yè);其次,騰訊以614億元排名第二,阿里以555億元排名第三?;ヂ?lián)網(wǎng)大廠每年研發(fā)投入資金就高達(dá)百億元,另外還擁有實(shí)力雄厚的研發(fā)團(tuán)隊(duì),在大模型賽道上是當(dāng)之無(wú)愧的“第一梯隊(duì)”玩家。
除了資金和技術(shù),人才也是大模型競(jìng)爭(zhēng)中不可或缺的一環(huán)。在今年第一季度,各家公司對(duì)頂級(jí)AI人才展開(kāi)了搶人大戰(zhàn)。王慧文表示要拿出75%的股份邀請(qǐng)頂級(jí)研發(fā)人才,李開(kāi)復(fù)喊話在全球范圍內(nèi)招募世界級(jí)人才,百度以25-40k/月薪資招聘AI大模型算法工程師、20-40k/月薪資招聘模型構(gòu)架工程師;阿里以40-70k/月薪資招聘大模型訓(xùn)練及算法工程師,各大公司求賢若渴。
相關(guān)數(shù)據(jù)顯示,今年一季度AI大模型相關(guān)職位的發(fā)布量同比增長(zhǎng)10.16%,是與ChatGPT相關(guān)增長(zhǎng)最多的領(lǐng)域,其中機(jī)器學(xué)習(xí)和算法工程師兩個(gè)職位的招聘年薪中位數(shù)均達(dá)到40萬(wàn)元以上。
國(guó)產(chǎn)大模型發(fā)展挑戰(zhàn)仍存,部分領(lǐng)域表現(xiàn)優(yōu)于國(guó)際模型
過(guò)去半年,大模型陸續(xù)發(fā)布,它們目前實(shí)力如何?據(jù)相關(guān)機(jī)構(gòu)對(duì)國(guó)內(nèi)外10款A(yù)I大模型的測(cè)評(píng),整體來(lái)看ChatGPT領(lǐng)先優(yōu)勢(shì)較為明顯,綜合數(shù)據(jù)位居第一。分板塊來(lái)看,國(guó)內(nèi)大模型在詞句理解和知識(shí)題方面超越國(guó)外模型,即國(guó)產(chǎn)AI大模型對(duì)?字的基礎(chǔ)認(rèn)知和學(xué)習(xí)能?較強(qiáng)。
而在6個(gè)國(guó)產(chǎn)大模型中,“文心一言”的綜合數(shù)據(jù)表現(xiàn)較為優(yōu)異,尤其是在詞句理解、編程、知識(shí)題以及翻譯方面領(lǐng)跑國(guó)產(chǎn)大語(yǔ)言模型;在商務(wù)寫(xiě)作方面,國(guó)內(nèi)產(chǎn)品表現(xiàn)最好的為“訊?星?”;在文學(xué)題方面,國(guó)內(nèi)產(chǎn)品“天?3.5”得分率最高,為88.33%,與ChatGPT得分持平;在邏輯推理方面,“文心一言”和“訊飛星火”表現(xiàn)相當(dāng)。
國(guó)內(nèi)大模型在一些細(xì)分領(lǐng)域其表現(xiàn)是十分優(yōu)異的,但與國(guó)外同類型產(chǎn)品還存在一定差距,在數(shù)據(jù)等核心技術(shù)以及落地場(chǎng)景方面還有很大的進(jìn)步空間。
在數(shù)據(jù)層面,大模型的發(fā)展需要高質(zhì)量的訓(xùn)練數(shù)據(jù)集。目前國(guó)內(nèi)基于中文語(yǔ)義的大模型訓(xùn)練所需要的中文數(shù)據(jù)總量不夠,而且質(zhì)量不高,優(yōu)質(zhì)中文大模型訓(xùn)練語(yǔ)料的稀缺也加大了差距。
在算力層面,按數(shù)據(jù)中心容量來(lái)統(tǒng)計(jì),2022年在這一領(lǐng)域領(lǐng)先的公司是谷歌、微軟、亞馬遜和Meta,這四個(gè)數(shù)據(jù)中心平臺(tái)占全球自建數(shù)據(jù)中心總?cè)萘康?成以上;而目前國(guó)內(nèi)雖已有像阿里、百度、騰訊等的一些頭部科技企業(yè)完成數(shù)據(jù)中心建設(shè),但在容量上和國(guó)外相比還有一定的差距。
在落地場(chǎng)景方面,不同細(xì)分場(chǎng)景落地的成本也是個(gè)問(wèn)題。要想得到一個(gè)足夠有效且好用的大模型,需要投入足夠多且有針對(duì)性的語(yǔ)料,這意味著不同細(xì)分場(chǎng)景的落地需要大量的成本投入。據(jù)估算,大模型訓(xùn)練一次的成本介于200萬(wàn)美元-1200萬(wàn)美元之間。由于訓(xùn)練成本過(guò)高,人工智能開(kāi)發(fā)公司Open AI 2022年虧損達(dá)到5.4億美元左右。所以AI大模型的商業(yè)變現(xiàn)還需要時(shí)間。
在這個(gè)競(jìng)爭(zhēng)激烈的賽道上,即使困難重重,國(guó)內(nèi)大模型都在朝著更完善的技術(shù)方向走去。而且賽道內(nèi)的競(jìng)爭(zhēng)也將加速國(guó)產(chǎn)大模型技術(shù)的發(fā)展步伐,推動(dòng)中國(guó)AI產(chǎn)業(yè)的整體技術(shù)升級(jí)。
數(shù)據(jù)來(lái)源:Structure Research、InfoQ研究中心、獵聘大數(shù)據(jù)、《中國(guó)人工智能大模型地圖研究報(bào)告》等公開(kāi)資料不完全整理。
關(guān)鍵詞: