女人久久久,最近更新中文字幕在线,成人国内精品久久久久影院vr,中文字幕亚洲综合久久综合,久久精品秘?一区二区三区美小说

原創(chuàng)生活

國內(nèi) 商業(yè) 滾動

基金 金融 股票

期貨金融

科技 行業(yè) 房產(chǎn)

銀行 公司 消費

生活滾動

保險 海外 觀察

財經(jīng) 生活 期貨

當(dāng)前位置:科技 >

商湯版ChatGPT來襲,中國激戰(zhàn)千億“大模型”

文章來源:鈦媒體APP  發(fā)布時間: 2023-04-11 13:09:26  責(zé)任編輯:cfenews.com
+|-

商湯上海總部(圖片來源:鈦媒體App編輯拍攝)

隨著ChatGPT為代表的預(yù)訓(xùn)練大模型帶來新一輪人工智能(AI)熱潮爆發(fā),繼百度、阿里、360之后,又一家大廠推出GPT大模型產(chǎn)品。

鈦媒體App獲悉,4月10日,AI 公司商湯科技正式發(fā)布全新“日日新SenseNova”大模型體系,以及自研的中文語言大模型應(yīng)用平臺“商量”(SenseChat),參數(shù)量達千億,可實現(xiàn)文本生成、圖像生成、多模態(tài)內(nèi)容生成等能力與場景應(yīng)用。


(相關(guān)資料圖)

商湯科技董事長兼CEO徐立表示,上述這些生成式人工智能(AIGC)產(chǎn)品將在醫(yī)療、短視頻、教育、營銷以及開發(fā)等產(chǎn)業(yè)領(lǐng)域應(yīng)用落地。

商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示,目前已經(jīng)有一些合作伙伴和客戶開始內(nèi)測其產(chǎn)品。未來,商湯版的GPT主要面向企業(yè)端(B2B)業(yè)務(wù)。此外,商湯“日日新SenseNova”大模型體系已全面支持了智能汽車、智慧生活、智慧商業(yè)、智慧城市等業(yè)務(wù)板塊,而且商湯將向客戶提供涵蓋圖片生成、自然語言對話、視覺推理和標(biāo)注服務(wù)等API接口。

事實上,自2022年12月開始,美國OpenAI公司推出的 AI 產(chǎn)品ChatGPT以及背后的GPT大模型,已經(jīng)引發(fā)了一場 AI 新浪潮。

但 AI 技術(shù)的終極目標(biāo) 通用人工智能(AGI)可不是誰都能獲得的?!镀纥c臨近》作者雷·庫茲韋爾曾表示,直到2029 年,人類才有超過50%的概率開發(fā)出AGI。而作為 AI 技術(shù)積累最深厚的中國公司,如今商湯抓住了大模型這波新浪潮,以期在未來幾年內(nèi)實現(xiàn)重大突破,從而邁向 AI 領(lǐng)域這顆皇冠上的明珠——AGI的前沿研發(fā)與商業(yè)化進程。

GPT大模型熱潮來襲

如今,火爆全網(wǎng)的 AI 聊天大模型應(yīng)用ChatGPT訪問量已飆升至8.89億次,它也是歷史上最快達到1億月活的應(yīng)用,而且整個熱潮已蔓延至微軟、谷歌等很多大廠開始關(guān)注大模型。過去40天,大模型集中爆發(fā),GPT-4、微軟Microsoft 365 Copilot、Midjourney V5、Google PaLM API、英偉達新顯卡接連出場。

尤其是微軟,將GPT-4接入Word、Excel、PowerPoint等Microsoft 365 Office辦公套件中,即推出一款新的 AI 驅(qū)動的產(chǎn)品Copilot(副駕駛),像助手一樣用 AI 幫助人們生成文檔、電子郵件、PPT等,從而讓 AI 接入了生產(chǎn)力。此外,創(chuàng)造出ChatGPT的美國OpenAI公司還推出插件功能,實現(xiàn)了“App Store時刻”,讓生成式 AI 真正變革了人類的生產(chǎn)力。

GPT-4加持的微軟Word平臺,支持自由編輯 AI 生成的文本

天津大學(xué)自然語言處理實驗室負責(zé)人、教授熊德意表示,從 AI 發(fā)展角度看,這是一個重要的里程碑,其意義要高于7年前的“阿爾法狗”。

實際上,過去60多年間,利用 AI 技術(shù),智能化、數(shù)字化和人口紅利共同推動了中國工業(yè)與產(chǎn)業(yè)快速發(fā)展,尤其是深度學(xué)習(xí)十年間的快速進步,真正讓 AI 在很多領(lǐng)域突破了“工業(yè)紅線”,在諸多特定的垂直場景中帶來了效率的提升。

不過,定制化AI模型的開發(fā)模式,依然面臨研發(fā)成本高、周期長等問題,而且現(xiàn)在80%的應(yīng)用場景都是低頻的、長尾的需求,但卻面臨投入大量人力、收集巨量數(shù)據(jù),卻不能解決小數(shù)據(jù)、小樣本等實際應(yīng)用問題。

而谷歌2017年發(fā)布的Transformer框架催生了新的研究范式,即基于一個強大的多模態(tài)大模型,使整個網(wǎng)絡(luò)結(jié)構(gòu)完全由Attention機制釋出,讓機器同時學(xué)習(xí)大量的文字,通過強化學(xué)習(xí)和人類反饋不斷強化大模型的學(xué)習(xí)能力,從而更高效地解決海量的開放式任務(wù),讓 AI 實現(xiàn)了從“數(shù)據(jù)飛輪”到“智慧飛輪”的演進,最終邁向 AGI 人機共智。

“AI 對于開發(fā)者來說是一種模式的變化,下一步對很多內(nèi)容創(chuàng)作者來說,一樣會面臨工作模式的巨大變化,未來人們不需要具備底層的制作能力,而是需要更多暢想、連接、協(xié)同的能力,這些能力才是跟AI協(xié)同共創(chuàng)的核心商業(yè)能力。而這種生產(chǎn)力模型的變革,可能會產(chǎn)生互聯(lián)網(wǎng)SaaS(軟件運營服務(wù))應(yīng)用和工具鏈,或者基于這些工具鏈新生成的社區(qū),也就是我們可能會擁有下一階段的‘小紅書’、B站等一系列互聯(lián)網(wǎng)應(yīng)用?!鄙虦萍级麻L兼CEO徐立,今年2月談及ChatGPT引發(fā)的商業(yè)產(chǎn)業(yè)變革時表示。

作為 AI 行業(yè)的領(lǐng)頭羊,商湯科技擁有很強的技術(shù)實力和積累,能夠參與到這場大模型軍備賽當(dāng)中。自2018年起,商湯科技便致力于 AI 大模型的研發(fā),有著超過5年的技術(shù)積淀和實踐經(jīng)驗。目前,商湯已成功研發(fā)了320億參數(shù)量的全球最大的通用視覺模型,在自動駕駛、工業(yè)質(zhì)檢、醫(yī)療影像等多個領(lǐng)域得到廣泛應(yīng)用。

“‘好的原材料’就是要深入到各個行業(yè)里積累非常多的know-how。美國公司OpenAI能夠把ChatGPT做出來,背后也有多年積累,從小模型到大模型的研發(fā),中間積累了非常多的know-how?!蓖鯐詣偙硎?,商湯具有非常類似的優(yōu)勢,內(nèi)部有非常多的研發(fā)人員能深入到一線,用大模型去解決實際問題,有很好的技術(shù)積累。

王曉剛強調(diào),“我們要擁抱全新研究范式,這里面的關(guān)鍵是我們要轉(zhuǎn)變觀念。十年前,商湯還沒有誕生,我們創(chuàng)始團隊在當(dāng)時做的決定就是-All In Deep Learning(深度學(xué)習(xí))。我們之前在傳統(tǒng)視覺技術(shù)里也有較長積累,但是,當(dāng)新技術(shù)來了,我們就果斷地去擁抱新技術(shù)。今天也一樣?!?/p>

實際上,本輪國產(chǎn)大模型競賽中,有三個能力極為重要:算力、數(shù)據(jù)和應(yīng)用場景。而在國內(nèi)致力于To B(企業(yè)端)業(yè)務(wù)的大廠中,商湯處于第一梯隊。

商湯科技前瞻布局,依托SenseCore AI大裝置,以5000 Petaflops超大規(guī)模算力和出色的并行計算能力,為大模型研發(fā)提供強大的算力基礎(chǔ)設(shè)施,堪比芯片行業(yè)的“光刻機”;同時還有數(shù)據(jù)算法和強大的產(chǎn)業(yè)化能力,在智慧城市、智慧商業(yè)等領(lǐng)域的長期耕耘,商湯積累了海量真實世界的高質(zhì)量視覺數(shù)據(jù),支持商湯在視覺技術(shù)方面的持續(xù)突破。領(lǐng)先的算力布局,以及豐富的視覺數(shù)據(jù)和技術(shù)積累,為商湯多模態(tài)大模型的研發(fā)提供有力基礎(chǔ)。

徐立曾表示,AI 的核心是解決“工業(yè)紅線”問題,而商湯SenseCore AI 大裝置相當(dāng)于粒子對撞機,成為業(yè)內(nèi)稀缺的大模型專用基礎(chǔ)設(shè)施,可以解決 AI 軟件所需算力支撐挑戰(zhàn)——類似光刻機,解決芯片的“工業(yè)紅線”。因此,如今基于“大模型+大算力”,商湯擁有了 AGI 時代的“光刻機”,成為 AGI 和大模型時代的基礎(chǔ)設(shè)施服務(wù)領(lǐng)導(dǎo)者,對整個行業(yè)具有重要的應(yīng)用價值和戰(zhàn)略意義。

“需要好的頂層設(shè)計,很好地把原材料設(shè)計成一個體系,商湯能朝著 AGI 的目標(biāo)努力。除了大裝置和基礎(chǔ)設(shè)施以外,還要能從算法、框架上,把整個系統(tǒng)設(shè)計好?!蓖鯐詣偙硎尽?/p>

王曉剛稱,如今,商湯研發(fā)想要做的事情就是怎么樣去用好這些新技術(shù)。它帶來的新范式包括人機共智,一起去創(chuàng)造新智慧。核心在于怎樣用好我們的這個大模型,能夠去形成正向的反饋,而不是一味地說“很害怕被顛覆了”。

千億商湯大模型有何新亮點?

最近幾天,國內(nèi)科技大廠的GPT AI 大模型密集呈現(xiàn),從百度的文心一言,到阿里通義、華為盤古和京東言犀,引發(fā)國內(nèi)企業(yè)的大模型“逐鹿潮”。

相對于其他大模型產(chǎn)品,商湯此次推出的千億大模型真正服務(wù)于To B(企業(yè))端客戶,而非一個被網(wǎng)絡(luò)調(diào)戲的工具。鈦媒體App梳理了四大亮點和優(yōu)勢,從體系、語言大模型平臺,到應(yīng)用場景和行業(yè)落地,打通大模型產(chǎn)業(yè)閉環(huán)。

首先是國內(nèi)首個大模型體系。

4月10日,商湯科技正式發(fā)布商湯“日日新SenseNova”大模型體系,基于數(shù)據(jù)、模型訓(xùn)練以及部署的三位一體的飛輪,提供自然語言生成、圖片生成、感知模型預(yù)標(biāo)注、模型研發(fā)等多種能力,并持續(xù)更新多模態(tài)大模型,同時結(jié)合決策智能大模型,是實現(xiàn)AGI的重要起點。

據(jù)悉,商湯“日日新SenseNova”大模型體系的名稱取自《禮記·大學(xué)》中,湯之盤銘曰:“茍日新、日日新、又日新”,商湯希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI更多可能。

實際上,大模型最核心的需求就是構(gòu)建體系架構(gòu)。而在前期,商湯前瞻性打造了人工智能基礎(chǔ)設(shè)施SenseCore AI大裝置——27000塊GPU(圖形處理器)芯片,5000 Petaflops超大規(guī)模算力、是亞洲最大的智能計算平臺之一、支持20個千億參數(shù)超大模型同時訓(xùn)練、支持最大4000卡并行單任務(wù)訓(xùn)練,可持續(xù)7天以上不間斷穩(wěn)定訓(xùn)練——這是國內(nèi)為數(shù)不多接近GPT所需算力的重要基礎(chǔ)設(shè)施公司。

如今,基于AISaaS服務(wù)架構(gòu),商湯已經(jīng)打造了CV(計算機視覺)、NLP(自然語言處理)、AIGC(人工智能內(nèi)容生成)多個AI大模型。未來基于這些核心優(yōu)勢,在“日日新SenseNova”大模型體系和SenseCore AI大裝置的支持下,商湯的多模態(tài)大模型持續(xù)演進,同時結(jié)合決策智能大模型,為AGI的實現(xiàn)提供重要起點。

第二大亮點是首個自研中文語言大模型應(yīng)用平臺。

在“日日新SenseNova”大模型體系當(dāng)中,商湯科技4月10日還推出了自研的中文語言大模型應(yīng)用平臺“商量”,具備領(lǐng)先的語言理解、生成能力,將科技與人文相互交融。作為高效聊天助手,它可以秒解復(fù)雜問題,提供定制化建議,還能輔助創(chuàng)作一流文本,并具備不斷學(xué)習(xí)進化的特性等。

具體來說,在用戶價值方面,“商量”可以實現(xiàn)單輪、多輪對話和超長文本理解能力,而且憑借“商量”中文語言大模型強大的長文本理解能力,幫助用戶快速通過與大模型互動來獲取知識、尋找答案;在技術(shù)能力優(yōu)勢方面,商湯擁有千億參數(shù)中文語言大模型,具備問答、理解與生成等全面的中文語言能力,支持企業(yè)服務(wù)、城市管理、汽車出行等600+垂直領(lǐng)域,并擁有邏輯推演與智能、兼具理解廣度與深度、知識自動及時更新等能力。

無論是一人一句編故事,還是連續(xù)對話能力,“商量”都能準(zhǔn)確、快捷的回答出來。

此外,“商量”已經(jīng)在行業(yè)實現(xiàn)了應(yīng)用,尤其在醫(yī)療行業(yè)和編程領(lǐng)域。從現(xiàn)場實際demo當(dāng)中可以看到,基于大模型應(yīng)用平臺,它能夠準(zhǔn)確、快捷地回答關(guān)于腹部痛等關(guān)鍵性問題,給出醫(yī)療參考方案。

第三大亮點是生成式AI應(yīng)用,真正為短視頻、直播產(chǎn)業(yè)帶來生產(chǎn)力提升。

此次,商湯把GPT大模型應(yīng)用于生成式 AI 領(lǐng)域,重構(gòu)人與空間在數(shù)字時代的結(jié)合。商湯基于“日日新SenseNova”大模型體系,自研了包括秒畫、如影、瓊宇、格物等視頻內(nèi)容的制作和生成工具平臺,為短視頻、直播產(chǎn)業(yè)帶來生產(chǎn)力的提升。

以“秒畫”為例,其是商湯科技打造的AI內(nèi)容創(chuàng)作社區(qū)平臺,可幫助用戶輕松地創(chuàng)作高質(zhì)量的藝術(shù)作品,自動生成元素和細節(jié),并可不斷學(xué)習(xí)與提升。其中,“秒畫”具備超10億參數(shù)自研文生圖生成模型,支持二次元、三次元等多種生成風(fēng)格;推理速度快,單卡支持每2秒生成1張512分辨率的圖片;用戶可基于單卡A100,5分鐘內(nèi)定制屬于自己的LoRA模型20張訓(xùn)練圖片;匯聚了1萬+開源模型,基于平臺發(fā)布的模型可設(shè)置為ToB服務(wù)API,結(jié)合商湯大算力對外提供商業(yè)化服務(wù),支持用戶訓(xùn)練個性化繪模型,滿足不同繪畫風(fēng)格需求。

“秒畫”帶來個性化文生圖能力(來源:商湯)

而另一種“瓊宇”、“格物” 3D內(nèi)容生成平臺,是商湯科技基于神經(jīng)輻射場技術(shù)(NeRF)的3D內(nèi)容生成平臺,分別是指瓊宇大空間3D內(nèi)容生成應(yīng)用、格物小物體3D內(nèi)容生成應(yīng)用,可基于 3D 內(nèi)容生成技術(shù)實現(xiàn)對空間和物體的復(fù)刻與交互。傳統(tǒng)人工建模10000人/天的建模任務(wù),通過“瓊宇”只需要2天即可完成(算力為1200 TFLOPS)。

商湯表示,上述兩套平臺生成的各類3D內(nèi)容都夠進行再編輯再創(chuàng)作,通過海量高精度數(shù)字資產(chǎn)的生產(chǎn),滿足影視創(chuàng)作、建筑設(shè)計、商品營銷、數(shù)字孿生管理等各類對可交互3D實景內(nèi)容有強烈需求的應(yīng)用場景。

最后一個亮點就是獨特的行業(yè)賦能。商湯讓大模型對外提供API接口,以及多元化、多種大模型即服務(wù)(MaaS)。

具體來說,在“一平臺四支柱”的戰(zhàn)略體系下,商湯“日日新SenseNova”大模型體系已全面支持了智能汽車、智慧生活、智慧商業(yè)、智慧城市等業(yè)務(wù)板塊,打通了多個領(lǐng)域、行業(yè)的應(yīng)用閉環(huán)。

而且,基于“日日新SenseNova”大模型體系,商湯將向客戶提供涵蓋圖片生成、自然語言對話、視覺推理和標(biāo)注服務(wù)等API接口??蛻艨筛鶕?jù)實際應(yīng)用需求,靈活調(diào)用商湯大模型的各項AI技術(shù)能力,低門檻、低成本、高效率地實現(xiàn)AI技術(shù)在實際業(yè)務(wù)環(huán)節(jié)中的部署,或進行二次開發(fā),創(chuàng)造更多價值。

此外,基于商湯AI大裝置和大模型體系,商湯將面向客戶提供涵蓋自動化數(shù)據(jù)標(biāo)注、大模型推理部署、大模型并行訓(xùn)練、大模型增量訓(xùn)練、開發(fā)者效率提升等多種大模型即服務(wù)(Model-as-a-Service),包括自動化數(shù)據(jù)標(biāo)注、大模型推理部署、大模型并行訓(xùn)練和大模型增量訓(xùn)練服務(wù)、開發(fā)者效率提升等。

“這絕對不只是說訓(xùn)練一個參數(shù)量非常大的模型,它是一個體系化的大工程?!蓖鯐詣偙硎?。

王曉剛提及,“涌現(xiàn)”這個現(xiàn)象的出現(xiàn)意味著大模型會不斷給你驚喜,大模型能有新能力。而商湯在大模型訓(xùn)練本身,以及know-how任務(wù)理解都有這樣的技術(shù)實力。結(jié)合自身的特點,具有通用性的商湯大模型,能夠真正去幫助客戶解決需求和問題。

“未來,我們也是希望能夠依靠社區(qū)的力量把我們的這些模型進行調(diào)教,不只有原始模型,還有各種各樣的這樣的一些模型存在,能夠更好的往前推進?!蓖鯐詣偺寡苑Q。

大模型只是起點,奔向 AGI 之路才是重點

對于整個 AI 技術(shù)進程來說,大模型絕對不是 AI 發(fā)展的終點,而只是起點。

1950年,才華橫溢的計算機科學(xué)家艾倫·圖靈提出了一個他稱之為“模仿游戲”的思想實驗。面試官通過打字機與兩個對象交談,知道一個是人,另一個是機器。圖靈建議,如果一臺機器能夠始終讓面試官相信它是人類,我們就可以說它有能力思考。這就是著名的“圖靈測試”。

后來的70年間,整個 AI 行業(yè)都為之努力,希望打造通過“圖靈測試評估”能力的 AI 技術(shù)。如今,AI 算法、算力、數(shù)據(jù)“三駕馬車”同步突破,AI 技術(shù)已經(jīng)蓄能完畢,所有人終于可以大展身手了。

作為中國 AI 領(lǐng)域競爭與發(fā)展的核心玩家,商湯擁有 AI 行業(yè)全棧性研發(fā)能力。

商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群副總裁陳宇恒表示,所謂的通用人工智能新的創(chuàng)新范式,可以極高的體現(xiàn)商湯現(xiàn)有的一些 AI 產(chǎn)品的模式和能力。從大的方向上,商湯作為人工智能的頭部的企業(yè),未來肯定還是要去挑戰(zhàn)更大的模型。因為現(xiàn)在很明顯的趨勢就是,每一代的大模型 AI 和算力有很大的相關(guān)性。

“下一代人工智能比上一代,比如說 GPT-4 比 GPT-3可能是百倍級的算力的需求,甚至它的參數(shù)量是十倍以上的需求,對應(yīng)也需要更多的數(shù)據(jù)去完成訓(xùn)練。所以要不斷地去接近所謂的通用人工智能或者 AGI 的路線上,肯定是要把基礎(chǔ)的超大模型越做越大。這是未來 2 到 3 年,整個無論從學(xué)術(shù)界還是從工業(yè)界,還是從我們自己的對 AI 的理解上,都是比較明確的方向。”陳宇恒表示。

此前,商湯科技發(fā)布了2022財年報告。

財報顯示,2022年,商湯研發(fā)支出達38億元人民幣(扣除以股份為基礎(chǔ)的薪酬開支),同比增長24%,2018年至今累計研發(fā)投入達128.47億元;人均每年研發(fā)模型數(shù)相較于2021年進一步提高了90%,累計生產(chǎn)的商用模型數(shù)提高了93%,至6.7萬個。

當(dāng)中國大力發(fā)展 AI 技術(shù)的重要時機下,商湯大量投入技術(shù)研發(fā),不斷推進數(shù)字化、智能化、產(chǎn)業(yè)化升級,符合科技創(chuàng)新下的時代特征,如今,商湯高強度的研發(fā)投入正在開花結(jié)果,在國內(nèi)大模型軍備賽中實現(xiàn)了第一梯隊的飛躍,成為行業(yè)極稀缺的“頭雁”。

英偉達CEO黃仁勛曾表示,當(dāng)下“我們正處于 Al 的iPhone時刻”。而商湯,也正在迎來屬于自己的“iPhone 時刻”。

“AI是生產(chǎn)‘生產(chǎn)力工具’的工具,它將開啟軟件開發(fā)新范式,把我們帶入‘新二八定律’的時代,80%的工作由機器完成,20%的工作由人來做。”徐立認為,持續(xù)的大規(guī)模技術(shù)投入帶來創(chuàng)新,再有商業(yè)模式發(fā)展,這是一條罕有人走的路。商湯始終堅信 AI 技術(shù)變革帶來增量價值,必將推動普惠和公平的智能時代到來。(本文首發(fā)鈦媒體App,作者|林志佳)

關(guān)鍵詞:

專題首頁|財金網(wǎng)首頁

投資
探索

精彩
互動

獨家
觀察

京ICP備2021034106號-38   營業(yè)執(zhí)照公示信息  聯(lián)系我們:55 16 53 8 @qq.com  財金網(wǎng)  版權(quán)所有  cfenews.com