女人久久久,最近更新中文字幕在线,成人国内精品久久久久影院vr,中文字幕亚洲综合久久综合,久久精品秘?一区二区三区美小说

原創(chuàng)生活

國內(nèi) 商業(yè) 滾動(dòng)

基金 金融 股票

期貨金融

科技 行業(yè) 房產(chǎn)

銀行 公司 消費(fèi)

生活滾動(dòng)

保險(xiǎn) 海外 觀察

財(cái)經(jīng) 生活 期貨

當(dāng)前位置:科技 >

【全球聚看點(diǎn)】行業(yè)大模型,開卷! | 鈦媒體深度

文章來源:鈦媒體APP  發(fā)布時(shí)間: 2023-07-01 10:27:02  責(zé)任編輯:cfenews.com
+|-

“文心一言看起來是匆忙上馬,我認(rèn)為這個(gè)東西根本就不是為了賺錢,就是為了能趕ChatGPT熱潮,行業(yè)大模型才是真正能產(chǎn)生商業(yè)價(jià)值的東西?!卑俣任男囊谎园l(fā)布后不久,一位前百度員工對鈦媒體表示,“去年OpenAI沒這么火的時(shí)候,王老師(百度CTO王海峰)帶隊(duì)搞了10個(gè)大模型,就包括行業(yè)大模型,當(dāng)時(shí)行業(yè)外關(guān)注不多,但如果現(xiàn)在看百度的布局,行業(yè)大模型其實(shí)是前瞻性布局,比OpenAI和微軟還早?!?/p>


【資料圖】

如今,通用大模型喧囂過后,行業(yè)模型正在逐漸占據(jù)聲量,也正印證這一現(xiàn)實(shí):類似ChatGPT等基礎(chǔ)大模型賺的是“吆喝”,很大程度上是起到教育市場、塑造認(rèn)知的作用,人工智能真正要落地、要賺到現(xiàn)在的錢,還要看行業(yè)大模型。

即便是海外市場,ChatGPT作為C端產(chǎn)品的部分屬性,熱度也已經(jīng)逐漸減弱——根據(jù)SimilarWeb數(shù)據(jù),前期ChatGPT的訪問量增長率驚人,1月份的環(huán)比增長率為131.6%,2月份為62.5%,3月份為55.8%,在4月份明顯放緩,環(huán)比增長率為12.6%,到了5月,這個(gè)數(shù)字已經(jīng)變?yōu)榱?.8%,并預(yù)計(jì)6月的環(huán)比增長率有可能為負(fù)數(shù)。

“相信我們當(dāng)中的很多人都試用過了ChatGPT,也相信很多人試用過之后,已經(jīng)將它放置一邊了,因?yàn)槟壳八臀覀兊墓ぷ骰旧线€是割裂的,所以用用就放下了。但我依然希望大家不要‘起個(gè)大早,趕了晚集’,因?yàn)檫@是一個(gè)會(huì)帶來顛覆性變革的范式革命?!蔽④洠ㄖ袊┕臼紫夹g(shù)官(CTO)韋青此前表示。

而基于ChatGPT或者大模型,打造的B端解決方案,正是解決大模型與場景割裂的良方。

國際上,微軟、亞馬遜等大廠也開始向企業(yè)級服務(wù)尋求商業(yè)化路徑,開始進(jìn)行多個(gè)行業(yè)的探索;國內(nèi),諸如百度、阿里、騰訊、華為都在快馬加鞭加速行業(yè)大模型投入。此外,很多全球范圍內(nèi)的行業(yè)龍頭和創(chuàng)業(yè)公司也正在探索行業(yè)大模型的前景,近日,北京市科委、中關(guān)村管委會(huì)也發(fā)布了北京市首批10個(gè)人工智能行業(yè)大模型應(yīng)用案例。此外,相關(guān)技術(shù)路線的企業(yè)并購金額也屢攀新高……

但大模型賽道還遠(yuǎn)遠(yuǎn)稱不上擁擠——伴隨技術(shù)迭代迎來飛躍式發(fā)展,各行各業(yè)正重新積累技術(shù)認(rèn)知、塑造業(yè)務(wù)模式,一切才剛剛開始。

升級:千模大戰(zhàn)

如果說基礎(chǔ)模型是“百模大戰(zhàn)”,行業(yè)大模型就是“千模大戰(zhàn)”,就像樹干長出樹枝,每個(gè)基礎(chǔ)大模型廠商都可以孵化數(shù)個(gè)行業(yè)大模型,大廠們的行動(dòng)默契而一致。

“雖然大家對通用大模型期待很高,但它不一定是滿足行業(yè)場景需求的最優(yōu)解?!?月19日,在騰訊云行業(yè)大模型發(fā)布會(huì)上,騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示。

在混元助手沒有對外發(fā)布的情況下,騰訊率先發(fā)布了行業(yè)大模型,依托騰訊云TI平臺(tái)打造的行業(yè)大模型精選商店,為客戶提供MaaS一站式服務(wù),幫助企業(yè)客戶構(gòu)建專屬大模型及智能應(yīng)用。從騰訊處獲悉,有關(guān)C端的通用大模型,騰訊將在后續(xù)發(fā)布官方消息。

這一系列舉措或許可以理解為,暫且不論混元基礎(chǔ)大模型的效果和進(jìn)展如何,優(yōu)先發(fā)布行業(yè)大模型,是在客戶急需的情況下,騰訊確保自身聲量、搶占市場客戶的必要之舉。

更早之前,華為云人工智能領(lǐng)域首席科學(xué)家田奇提到,華為把大模型分成三個(gè)層級,L0、L1、L2,L0就是大家所說的基礎(chǔ)通用模型,像GPT-3,在基礎(chǔ)模型L0的基礎(chǔ)上,加上行業(yè)數(shù)據(jù),混合訓(xùn)練得到的行業(yè)大模型是L1。

然后再把L1針對具體下游千行百業(yè)的細(xì)分場景進(jìn)行一些部署,得到細(xì)分場景的任務(wù)模型L2,為了盡快降低生產(chǎn)成本、提高效率,如何從行業(yè)大模型L1中快速生產(chǎn)L2模型,還有部署L2模型到端側(cè)、邊側(cè)和云側(cè),這是非常重要的問題。

在7月即將舉辦的華為開發(fā)者大會(huì)的議程上可以看到,華為云將對盤古大模型如何從基礎(chǔ)大模型煉成行業(yè)大模型進(jìn)行一系列的解讀和發(fā)布。

在今年的阿里云峰會(huì)上,阿里云CTO周靖人也表示,“今天不是所有的企業(yè)都需要從頭開始訓(xùn)練,也不需要大家從頭開始去做多種語料,包括大量的算力資源,從頭開始做大模型的一系列定制,我們希望今天通義千問模型之上,結(jié)合企業(yè)的場景、企業(yè)的知識體系、企業(yè)的行業(yè)特殊需求,產(chǎn)生一個(gè)個(gè)企業(yè)專屬模型?!?/p>

微軟也在做自己的行業(yè)大模型。4月份,在國內(nèi),針對本土出海企業(yè)用戶,微軟Azure OpenAI Service國際版發(fā)布了首批三套面向零售電商、制造業(yè)和數(shù)字原生領(lǐng)域的Azure全球創(chuàng)新行業(yè)場景,集成GPT-3、GPT-4、Codex、DALL-E和企業(yè)級ChatGPT等五種大模型服務(wù),幫助中國出海企業(yè)客戶加速拓展全球市場。

“千模大戰(zhàn)”一觸即發(fā),但真正進(jìn)入大浪淘沙的階段還為時(shí)尚早——整體來說,大模型還處于比較早期的發(fā)展階段,盡管行業(yè)大模型集中涌現(xiàn),但這條賽道顯然有更大空間。

以金融行業(yè)大模型為例,其分成券商、保險(xiǎn)、銀行、新金融等不同領(lǐng)域,每個(gè)領(lǐng)域的下游任務(wù)又分成幾十上百種的子任務(wù)。

“更重要的時(shí)刻,是接下來基于基礎(chǔ)模型,通過SFT等機(jī)制和構(gòu)建出能夠高效適配下游任務(wù),并且在金融行業(yè)或者其他行業(yè)模型的下游任務(wù)產(chǎn)生規(guī)模效應(yīng)化的時(shí)候?!痹诎⒗锇桶瓦_(dá)摩院創(chuàng)新業(yè)務(wù)中心負(fù)責(zé)人陳海青看來,只是通過一些普適的非結(jié)構(gòu)化數(shù)據(jù)做繼續(xù)訓(xùn)練的行業(yè)大模型和場景,才算剛剛開始。

理智且現(xiàn)實(shí)的選擇

如果企業(yè)要做一個(gè)千億級參數(shù)的基礎(chǔ)大模型,需要單機(jī)群萬卡以上的算力,不僅要有GPU卡,還要把GPU的集群資源利用起來,大部分公司都無法做到。

而行業(yè)大模型顯然更容易實(shí)現(xiàn),同時(shí)也兼具更廣闊的應(yīng)用前景。

“大模型賦能千行百業(yè),但是對千行百業(yè)的場景要非常理解,不能指望訓(xùn)練出千億或者萬億大模型,企業(yè)用戶拿去就好用”,瀾舟科技創(chuàng)始人周明說?!皬耐ㄓ媚P偷叫袠I(yè)模型,要針對用戶的場景做最后一公里的事情。”

在評估基礎(chǔ)大模型所需要的投入,權(quán)衡利弊與得失之后,企業(yè)客戶迅速轉(zhuǎn)向行業(yè)大模型,廠商的精力也更多投入于此。

湯道生坦言,目前通用大模型一般都是基于廣泛的公開文獻(xiàn)與網(wǎng)絡(luò)信息來訓(xùn)練的,網(wǎng)上的信息可能有錯(cuò)誤、有謠言、有偏見,許多專業(yè)知識與行業(yè)數(shù)據(jù)積累不足,導(dǎo)致模型的行業(yè)針對性與精準(zhǔn)度不夠,數(shù)據(jù)“噪音”過大。

但是,在很多產(chǎn)業(yè)場景中,用戶對企業(yè)提供的專業(yè)服務(wù)要求高,容錯(cuò)性低。企業(yè)一旦提供了錯(cuò)誤信息,可能引起巨大的法律責(zé)任或公關(guān)危機(jī)。因此,企業(yè)使用的大模型必須可控、可追溯、可修正,而且必須反復(fù)與充分測試才能上線。

“我們認(rèn)為,客戶更需要有行業(yè)針對性的行業(yè)大模型,再加上企業(yè)自己的數(shù)據(jù)做訓(xùn)練或精調(diào),才能打造出實(shí)用性高的智能服務(wù)。企業(yè)所需要的是在實(shí)際場景中真正解決了某個(gè)問題,而不是在100個(gè)場景中解決了70%-80%的問題?!睖郎硎尽?/p>

百度智能云副總裁朱勇也表示,“從國內(nèi)和國外的情況可以看到,真正做通用模型的并沒有那么多,市面上有一些廠商做的實(shí)際上是比較小型的模型。相反,領(lǐng)域模型特別重要,因?yàn)橥ㄓ媚P椭痪邆渫ㄗR能力,領(lǐng)域模型可以跟特定行業(yè)、領(lǐng)域的任務(wù)預(yù)期對齊,解決業(yè)務(wù)的實(shí)際問題,這個(gè)過程非常重要,但這個(gè)過程所需要的代價(jià)和資源遠(yuǎn)遠(yuǎn)小于從零開始做底層通用模型?!?/p>

同時(shí)他還判斷,未來基礎(chǔ)模型(底層通用模型)可能就幾家,但是結(jié)合專業(yè)領(lǐng)域的數(shù)據(jù)、行業(yè)know how,上面會(huì)長出很多不同類型的領(lǐng)域模型,這些領(lǐng)域模型將來會(huì)非常繁榮,支撐上層繁榮的領(lǐng)域應(yīng)用。

以百度智能云和國網(wǎng)打造的能源行業(yè)大模型“國網(wǎng)-百度·文心”為例,百度智能云與國網(wǎng)專家們一起,在通用大模型行中引入國網(wǎng)在電力業(yè)務(wù)積累的樣本數(shù)據(jù)和特有知識,并且在訓(xùn)練中,結(jié)合雙方在預(yù)訓(xùn)練算法和電力領(lǐng)域業(yè)務(wù)與算法的經(jīng)驗(yàn),設(shè)計(jì)電力領(lǐng)域?qū)嶓w判別、電力領(lǐng)域文檔判別等算法作為預(yù)訓(xùn)練任務(wù),讓文心大模型深入學(xué)習(xí)電力專業(yè)知識,從而真正解決能源領(lǐng)域的實(shí)際業(yè)務(wù)問題,達(dá)到降本增效的目的。

朱勇表示,通用模型跟領(lǐng)域模型的區(qū)別,可以把通用模型比作上了大學(xué)知識面很廣的人,他也許知道一些醫(yī)學(xué)的知識,但不能給病人做診斷,不是專業(yè)的醫(yī)生。而領(lǐng)域模型就是在通用能力很強(qiáng)的基礎(chǔ)上,深入學(xué)習(xí)醫(yī)學(xué)知識,成為了一名專業(yè)醫(yī)生,可以在醫(yī)學(xué)領(lǐng)域貢獻(xiàn)價(jià)值。

從具備很廣知識面的通用模型往專業(yè)的醫(yī)學(xué)模型,這中間所需要的資源代價(jià),要遠(yuǎn)遠(yuǎn)少于從零到一開始建立通用大模型,但它強(qiáng)調(diào)的是有專業(yè)的數(shù)據(jù),要有專業(yè)領(lǐng)域的任務(wù)來驅(qū)動(dòng),來激發(fā)它產(chǎn)生這樣的能力。

行業(yè)大模型怎么做

大模型本身就是一個(gè)新生事物,它改變了以往的軟件開發(fā)范式,廠商們更需要一套新的工具鏈和平臺(tái),幫助客戶更早更快打磨行業(yè)大模型。

隨著大模型時(shí)代的到來,最后一公里的效率會(huì)大幅度提升。周明提到,新一代軟件開發(fā)范式正在形成,主要是基于企業(yè)prompt提供很多功能引擎,用戶現(xiàn)在是助手可以提高效率,在這個(gè)基礎(chǔ)上把自己的用戶體驗(yàn)想清楚、設(shè)計(jì)好,就很容易地構(gòu)造一種新的應(yīng)用。

以文心千帆大模型平臺(tái)為例,是面向企業(yè)開發(fā)者的一站式大模型開發(fā)及服務(wù)運(yùn)行平臺(tái)。不僅提供了包括文心一言底層模型(ERNIE-Bot)和第三方開源大模型,還提供了各種AI開發(fā)工具和整套開發(fā)環(huán)境,方便客戶輕松使用和開發(fā)大模型應(yīng)用。

諸如數(shù)據(jù)管理、自動(dòng)化模型SFT以及推理服務(wù)云端部署,廠商希望能夠?qū)崿F(xiàn)一站式大模型定制服務(wù)。不同廠商的大模型構(gòu)建平臺(tái)能力基本相似,不同的是易用性、效果好壞、支持的軟硬件等方面。

“做大模型確實(shí)不便宜,但最終能夠讓大模型服務(wù)推廣開來的原因只有兩個(gè):第一個(gè)是模型效果要好,模型效果不好,其他都不用講,第二個(gè)就是成本?!卑俣戎悄茉?AI 與大數(shù)據(jù)平臺(tái)總經(jīng)理忻舟表示。

在效果上,行業(yè)模型要依托于通用大模型。比如通識教育,如果沒有比較好的通用模型就沒法談在具體一個(gè)行業(yè)的應(yīng)用效果。Bloomberg和約翰霍普金斯一起推出的Bloomberg GPT就是例子,在它的數(shù)據(jù)分布中,通用基礎(chǔ)模型數(shù)據(jù)占一半,金融行業(yè)公開數(shù)據(jù)占一半,還有Bloomberg自己的數(shù)據(jù)占0.6%。

“任何一個(gè)模型要能達(dá)到較好的智能水平或者基礎(chǔ)能力,一定得在比較好的參數(shù)量訓(xùn)練基礎(chǔ)模型,在基礎(chǔ)模型上再融入一些行業(yè)專業(yè)數(shù)據(jù)做行業(yè)模型?!毙弥壅f。

百度的思路是先推出一個(gè)“大家伙”(文心一言),一個(gè)非常完整的工具平臺(tái)(文心千帆),然后根據(jù)客戶實(shí)際需求提供差異化的模型服務(wù),幫助客戶做性價(jià)比最高的選擇,他們認(rèn)為,價(jià)格不會(huì)成為企業(yè)擁抱大模型的瓶頸。

除了模型調(diào)用成本、訓(xùn)練成本,百度還在幫助企業(yè)做進(jìn)一步的成本下降,如果企業(yè)只是聚焦在自己相對比較狹窄的領(lǐng)域上,百度也有相對低參數(shù)的版本,這樣在保證模型效果的同時(shí),使用或者訓(xùn)練模型的成本將會(huì)大幅下降。

事實(shí)上,打造行業(yè)大模型的成本沒有通用標(biāo)準(zhǔn)。

首先,不同的基礎(chǔ)大模型有不同的參數(shù)規(guī)格,軟硬件投入要根據(jù)模型的基礎(chǔ)參數(shù)和能力動(dòng)態(tài)變化。如果是百億參數(shù),一臺(tái)A100卡也能跑起來,就能開始下游任務(wù)。

當(dāng)前比較集中的應(yīng)用場景需求就屬于這類,比如知識管理類中智能問答、智能寫作、智能創(chuàng)作,還有泛互聯(lián)網(wǎng)營銷場景和代碼生成的需求。

其次,成本跟數(shù)據(jù)量和應(yīng)用方向有關(guān)。當(dāng)前全球大模型定價(jià)都是以1000 Token為基礎(chǔ)單位計(jì)費(fèi)。如果企業(yè)的下游任務(wù)很簡單,只需要幾萬token就能做好,那它的成本就非常低,需要的GPU卡就非常少。而構(gòu)建一個(gè)行業(yè)大模型所需的數(shù)據(jù)量通常以G甚至以T為單位,那它的離線訓(xùn)練成本就會(huì)非常高。

誰在搶跑?

大模型賽道玩家蜂擁而至,這次不僅僅是一線互聯(lián)網(wǎng)大廠,還有更多行業(yè)龍頭和創(chuàng)業(yè)公司加入。

哪些行業(yè)能率先突圍?或許從合作案例所處行業(yè)可以窺見一斑,如文章開頭的表格所示,金融、醫(yī)療、教育、自動(dòng)駕駛等領(lǐng)域應(yīng)用頻繁。

例如,阿里云在四月份發(fā)布通義大模型時(shí)宣布已和多家企業(yè)已經(jīng)展開了合作探索,首批合作的企業(yè)有OPPO安第斯智能云、吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂、波司登、掌悅科技等。據(jù)介紹,金融行業(yè)、零售行業(yè),以及一些面向大型C端的場景和行業(yè)已經(jīng)積累了比較多的公開數(shù)據(jù)、場景數(shù)據(jù),便于構(gòu)建企業(yè)或者行業(yè)專屬模型。

據(jù)公開資料顯示,百度文心行業(yè)大模型的數(shù)量已經(jīng)達(dá)到11個(gè),覆蓋能源電力、金融、航天、傳媒、影視、汽車、城市管理、燃?xì)?、保險(xiǎn)、電子制造和社科多個(gè)領(lǐng)域。

6月27日發(fā)布的北京市首批十個(gè)人工智能行業(yè)大模型應(yīng)用案例涉及能源電力、醫(yī)療健康、金融、自動(dòng)駕駛、建筑、科研、生活、問答等領(lǐng)域。據(jù)悉,6月27日至7月30日期間,北京市科委、中關(guān)村管委會(huì)還將聚焦城市治理、醫(yī)療健康、科學(xué)研究、智慧金融、智慧生活、智慧城市等重點(diǎn)領(lǐng)域,面向全市創(chuàng)新主體,將征集80余項(xiàng)行業(yè)大模型應(yīng)用案例項(xiàng)目。

但更多的客戶正面臨一波新的知識積累和學(xué)習(xí)的過程。

“我們和客戶交流時(shí)發(fā)現(xiàn),很多客戶對行業(yè)大模型還不太了解,但會(huì)主動(dòng)提出需要百度的行業(yè)大模型。”百度智能云AI平臺(tái)副總經(jīng)理李景秋說,這個(gè)時(shí)候會(huì)具體結(jié)合企業(yè)實(shí)際用的產(chǎn)品跟客戶解析需求,例如希望行業(yè)大模型具備什么樣的能力、用在什么系統(tǒng)或應(yīng)用里面、這些應(yīng)用到底被誰用、希望達(dá)到什么效果……這些問題問完之后,才會(huì)真正發(fā)現(xiàn)客戶需要的是基于文心千帆的工具鏈SFT的大模型,還是要構(gòu)建行業(yè)的預(yù)訓(xùn)練模型。后者起碼需要幾個(gè)月、甚至上年的時(shí)間去構(gòu)建部署——從數(shù)據(jù)的處理、算力層的資源配置等技術(shù)問題,到跟行業(yè)通用數(shù)據(jù)的長期訓(xùn)練。

從基礎(chǔ)大模型喧囂漸遠(yuǎn),到行業(yè)大模型華燈初上,邁入2023年下半年,一場真正的商業(yè)變革將加速啟動(dòng)。

對比百度等國內(nèi)廠商和OpenAI/微軟在大模型領(lǐng)域的路徑,也是一件頗有意思的事情——在ChatGPT呈現(xiàn)全球現(xiàn)象級熱度時(shí),有聲音質(zhì)疑,中國為什么做不出來ChatGPT,其中固然有技術(shù)環(huán)境、商業(yè)氛圍等一系列的復(fù)雜成因,最終很多人還是有一個(gè)粗淺的共識——“中國AI更傾向于業(yè)務(wù)應(yīng)用和商業(yè)化的能力”,直白點(diǎn)說,中國AI耐心更少,更想賺錢。

但反過來講,市場是技術(shù)發(fā)展的最大推動(dòng)力,對于時(shí)間和節(jié)奏的把握,造就了不同的結(jié)果。就以行業(yè)大模型為例,微軟或是在等待技術(shù)的進(jìn)一步成熟,或是覺得還沒到時(shí)機(jī),慢了一步,國內(nèi)廠商迅速從基礎(chǔ)大模型過渡到行業(yè)大模型,大模型落地于場景,才能有持久的生命力。

失之東隅,收之桑榆,以結(jié)果論,國內(nèi)行業(yè)大模型跑得快,不是一件壞事。

(本文首發(fā)鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達(dá))

關(guān)鍵詞:

專題首頁|財(cái)金網(wǎng)首頁

投資
探索

精彩
互動(dòng)

獨(dú)家
觀察

京ICP備2021034106號-38   營業(yè)執(zhí)照公示信息  聯(lián)系我們:55 16 53 8 @qq.com 關(guān)于我們 財(cái)金網(wǎng)  版權(quán)所有  cfenews.com