蜜度參展2023年世界人工智能大會(來源:鈦媒體App編輯拍攝)
隨著人工智能(AI)大模型熱潮以及中國支持 AI 產(chǎn)業(yè)發(fā)展,國內(nèi) AI 企業(yè)發(fā)現(xiàn)新機(jī)遇。
【資料圖】
鈦媒體App 獲悉,7月6日至8日舉行的2023世界人工智能大會(WAIC)期間,語言智能科技企業(yè)上海蜜度信息技術(shù)有限公司(MIDU,以下簡稱“蜜度”)發(fā)布自主研發(fā)的3個行業(yè)領(lǐng)域AI大模型,應(yīng)用于出版、媒體、政務(wù)、教育等行業(yè)。
具體包括用于輔助寫作、新聞稿件輔助生成的蜜巢知識問答與內(nèi)容生成大語言模型,是首個軟硬件一體國產(chǎn)化知識問答與內(nèi)容生成大語言模型;國內(nèi)首個智能校對領(lǐng)域大語言模型“蜜度文修”;蜜巢智能輿情分析大語言模型,以及旗下生成式 AI(AIGC)應(yīng)用產(chǎn)品“蜜小豆”、“文稿通”等。
蜜度首席技術(shù)官(CTO)劉益東對鈦媒體App表示,此次發(fā)布的三款行業(yè)垂直領(lǐng)域大語言模型,參數(shù)量在幾十億左右,優(yōu)勢在于語料質(zhì)量高、公司對數(shù)據(jù)積累和理解能力較強(qiáng)、有豐富的經(jīng)驗更好落地服務(wù)客戶等。目前,蜜巢系列行業(yè)大模型已逐步嘗試部署在政務(wù)、媒體等內(nèi)容生產(chǎn)強(qiáng)需求場景當(dāng)中。
據(jù)悉,蜜度成立于2009年,是一家以 AI 技術(shù)為核心的語言智能科技企業(yè),專注于多模態(tài)多語言智能科技,利用跨模態(tài)檢索(CMR)、多語言校對(MLC)、計算機(jī)視覺(CV)、自然語言處理(NLP)、知識圖譜(KG)等技術(shù),為政府和企業(yè)各類辦公場景提供智能應(yīng)用軟件產(chǎn)品,以及全方位的智能應(yīng)用解決方案。
天眼查信息顯示,蜜度公司股東中有北京微夢創(chuàng)科創(chuàng)業(yè)投資管理公司,持股比例21.57%。同時,去年9月6日,蜜度宣布與華為昇騰深度合作,目前蜜度已使用華為云基礎(chǔ)設(shè)施產(chǎn)品展開業(yè)務(wù)商業(yè)落地。
劉益東于2009年參與創(chuàng)辦蜜度,現(xiàn)任蜜度CTO,主要負(fù)責(zé)公司技術(shù)研究與應(yīng)用工作,推動 AI 技術(shù)應(yīng)用落地。劉益東畢業(yè)于哈爾濱工業(yè)大學(xué),獲計算機(jī)專業(yè)工學(xué)學(xué)士學(xué)位、軟件工程碩士學(xué)位,而且擁有18年互聯(lián)網(wǎng)行業(yè)從業(yè)經(jīng)驗、10年大數(shù)據(jù)研發(fā)經(jīng)驗。
劉益東認(rèn)為,此次蜜度發(fā)布大模型產(chǎn)品并不是“蹭熱點”,而是有很多行業(yè)數(shù)據(jù)積累形成的技術(shù)產(chǎn)品落地。他告訴鈦媒體App,蜜度自2015年起專注于語言智能技術(shù)方向,在多模態(tài)、中文互聯(lián)網(wǎng)數(shù)據(jù)積累上有一定優(yōu)勢,尤其是行業(yè)數(shù)據(jù)、客戶理解積累上優(yōu)勢明顯,有數(shù)據(jù)內(nèi)容和生成場景。
具體來說,蜜度自主研發(fā)的蜜巢知識問答與內(nèi)容生成大語言模型,專注于政府與企業(yè)內(nèi)部定制化內(nèi)容生成的場景,模型能夠?qū)崟r基于用戶所輸入的文檔進(jìn)行知識增強(qiáng),并對文檔中的相關(guān)知識進(jìn)行定制化的知識問答與內(nèi)容生成,真正實現(xiàn)“千文千面,千人千面”式內(nèi)容生成,打造屬于每個人自己的知識問答與內(nèi)容生成大模型。同時該模型適配華為全棧國產(chǎn)軟硬件一體化生態(tài),可在專網(wǎng)環(huán)境本地部署使用,提供更加高效、穩(wěn)定和安全的定制化內(nèi)容生成服務(wù)。
而蜜度文修是蜜度自研的國內(nèi)首個專為智能校對領(lǐng)域打造的垂直大語言模型,以大語言模型(LLM)為技術(shù)底座,通過運用高質(zhì)量數(shù)據(jù)學(xué)習(xí)多種特色子任務(wù),大幅度提升中文校對和潤色能力的智能化程度。不僅輔助專業(yè)用戶提高校對質(zhì)量、提升校對速度、降低差錯率,在新聞出版、媒體、政務(wù)、央企國企、教育等行業(yè)實現(xiàn)快速落地。
值得一提的是,去年WAIC大會期間,蜜度就展示了 AI 圖像生成、智能文本校對的技術(shù)能力,比如智能文本校對語音助手“蜜小?!钡犬a(chǎn)品。
劉益東直言,過去半年間,團(tuán)隊一直致力于打造優(yōu)質(zhì)數(shù)據(jù)構(gòu)建、數(shù)據(jù)訓(xùn)練輸出能力,以此形成ChatGPT、DALL·E 2這類產(chǎn)品的對話交互、高質(zhì)量圖像生成的優(yōu)質(zhì)體驗。而與GPT不同的是,蜜巢大語言模型更多用于政務(wù)、媒體行業(yè)等垂直領(lǐng)域,并非ChatGPT這種千億級通用大模型。
對于企業(yè)使用私有云造成大模型難迭代的話題,劉益東向鈦媒體App透露,相對于阿里、字節(jié)等大公司的基座大模型,蜜度更多是把企業(yè)自身的公開數(shù)據(jù)進(jìn)入蜜巢大模型知識層中,做一些簡單的知識問答、命題寫作等方案,然后在企業(yè)自身環(huán)境中去部署蜜巢大語言模型,注入企業(yè)自身的知識庫“內(nèi)循環(huán)”升級迭代,而不是做定制化大模型方案。
算力是當(dāng)前 AI 大模型發(fā)展的重要挑戰(zhàn),英偉達(dá)顯卡成為大模型的“入場券”。劉益東表示,目前蜜度擁有的算力可以支撐十億級大模型自主訓(xùn)練。而從長期布局,蜜度主要將控制參數(shù)規(guī)模、控制算力成本,另外擴(kuò)展云端數(shù)據(jù)中心這種臨時性算力方案,以解決未來更大參數(shù)、龐大規(guī)模訓(xùn)練等需求響應(yīng)。據(jù)悉,自去年開始,蜜度和華為 AI 算力產(chǎn)品深度合作,而華為的算力也在支持蜜度做國產(chǎn)化大模型,整個產(chǎn)品更自主可控。
劉益東認(rèn)為,當(dāng)前 AI 大模型行業(yè)應(yīng)用仍面臨三重挑戰(zhàn):一是客戶場景能不能支持這種投入產(chǎn)出比;二是大模型在云端的能力能否實現(xiàn)過程的安全可控,讓客戶放心;三是服務(wù)好一個垂直的垂直行業(yè),需要關(guān)注不同方面的個性化需求,通用大模型很難全面滿足。
劉益東向鈦媒體App透露,基于當(dāng)前十億級參數(shù)的垂直領(lǐng)域大模型基礎(chǔ),以及開源生態(tài)發(fā)展、大模型基座模型訓(xùn)練、算力能力增長等因素,接下來蜜度團(tuán)隊將全面打造蜜巢行業(yè)基座大語言模型,預(yù)計2023年底前,蜜巢將實現(xiàn)百億級別參數(shù)、千億級Token以及聚焦行業(yè)場景的泛化能力。
“我們還是會聚焦目標(biāo)市場,以給客戶提供優(yōu)質(zhì) AI 產(chǎn)品跟服務(wù)為己任,這是我們公司的定位。我們都在探索垂直行業(yè)的大模型工作,希望能在現(xiàn)有需求基礎(chǔ)上,能迅速把 AI 大模型商業(yè)化并形成規(guī)模效應(yīng)?!眲⒁鏂|表示,蜜度希望其大模型產(chǎn)品能為中國數(shù)字經(jīng)濟(jì)做出一定貢獻(xiàn)。(本文首發(fā)鈦媒體App,作者|林志佳)
關(guān)鍵詞: