2018年至今,NLP領(lǐng)域經(jīng)歷了非常大的變化,Transformer、ELMO、BERT、GPT-3,再到最近的ChatGPT(GPT 3.5的微調(diào))的突破,NLP在預(yù)訓(xùn)練大模型的暴力拆解路上越走越遠(yuǎn),這也讓各行業(yè)開(kāi)始相信:很多之前無(wú)法做到的場(chǎng)景、效果,現(xiàn)在可以有新的解法和落地。
智能客服,是NLP和深度學(xué)習(xí)技術(shù)落地的重要領(lǐng)域之一??头梢曰谔崆霸O(shè)定好的規(guī)則,對(duì)用戶(hù)意圖進(jìn)行判斷并生成對(duì)應(yīng)的固定話(huà)術(shù)。文本機(jī)器人、外呼機(jī)器人,可以替代掉原有重復(fù)性比較強(qiáng)的人工動(dòng)作,逐漸轉(zhuǎn)變?yōu)橄鄬?duì)日常的落地場(chǎng)景。比如你日常所接聽(tīng)到的快遞客服電話(huà),訂單咨詢(xún)的對(duì)話(huà)框等等,背后都有來(lái)自客服機(jī)器人的驅(qū)動(dòng)。
但在對(duì)客服要求比較高的企業(yè)級(jí)場(chǎng)景中,對(duì)多輪對(duì)話(huà)理解用戶(hù)意圖和知識(shí)專(zhuān)業(yè)度要求較高,現(xiàn)有的客服機(jī)器人仍有很高提升的空間。
【資料圖】
一是系統(tǒng)整體搭建的維護(hù)成本比較高,效率比較低,因?yàn)榇蠖鄶?shù)的企業(yè)級(jí)智能客服的知識(shí)庫(kù)不是流程化的,而是技術(shù)知識(shí)庫(kù),需要人工/半自動(dòng)的方式進(jìn)行搭建。二是業(yè)務(wù)場(chǎng)景復(fù)雜,專(zhuān)門(mén)知識(shí)門(mén)檻會(huì)更高,往往會(huì)涉及不同客戶(hù)的應(yīng)用場(chǎng)景,與業(yè)務(wù)流程相關(guān)的復(fù)雜場(chǎng)景。三是持續(xù)突破比較難,邊際效益遞減明顯,一般在良好技術(shù)知識(shí)庫(kù)的支撐下,企業(yè)級(jí)智能客服的起步較快,但受制于方法論的影響,前期需要投入的大量人力、算力和數(shù)據(jù),而到一定階段則會(huì)陷入提升的瓶頸。
這樣的問(wèn)題也曾經(jīng)困擾浪潮信息的客服系統(tǒng)研發(fā)人員。
近日,鈦媒體App對(duì)話(huà)浪潮信息服務(wù)總監(jiān)陳彬、浪潮信息AI軟件研發(fā)總監(jiān)吳韶華,圍繞智能客服市場(chǎng)當(dāng)前解決的難題,以AI大模型的實(shí)際落地應(yīng)用為視角,進(jìn)行深入交流。
具體來(lái)講,浪潮信息以AI大模型“源”為智能引擎,和InService智能服務(wù)平臺(tái),搭建出了“智能客服大腦”。
據(jù)介紹,“智能客服大腦”學(xué)習(xí)了2萬(wàn)余份產(chǎn)品文檔和用戶(hù)手冊(cè)的數(shù)據(jù),并結(jié)合百萬(wàn)條浪潮信息專(zhuān)家工程師服務(wù)對(duì)話(huà)、數(shù)十萬(wàn)份日志、工單數(shù)據(jù)等算法訓(xùn)練,具備語(yǔ)言理解、數(shù)據(jù)分析、自主學(xué)習(xí)和智能推理等能力,支持自然語(yǔ)言交互服務(wù)、已授權(quán)IT設(shè)備的智能運(yùn)維與診斷、以及備品備件等資源的智能管理和調(diào)度。
AI大模型在應(yīng)用過(guò)程中必然會(huì)面臨各個(gè)行業(yè)的應(yīng)用落地。在此之前,浪潮AI大模型“源”已經(jīng)在人機(jī)交互、知識(shí)檢索、語(yǔ)言翻譯、文學(xué)創(chuàng)作等領(lǐng)域有所應(yīng)用。
以大模型作為基礎(chǔ)能力,通過(guò)大模型的蒸餾實(shí)現(xiàn)相關(guān)的小模型,不僅實(shí)現(xiàn)的速度更快,智能化水平更高,從技術(shù)角度來(lái)講,大模型在落地過(guò)程中呈現(xiàn)出了與以往模型非常不同的技術(shù)特征,也帶來(lái)了更好的智能化水平。不論對(duì)大模型進(jìn)行微調(diào),還是引入領(lǐng)域知識(shí)庫(kù)的方式,均是業(yè)界在探索的路徑。
在浪潮信息AI軟件研發(fā)總監(jiān)吳韶華看來(lái),“大模型想要在某個(gè)方向上訓(xùn)練得更好,智能化水平更高,確實(shí)需要在具體落地場(chǎng)景引入額外的領(lǐng)域知識(shí),才能解決實(shí)際問(wèn)題。AI大模型有其自身特點(diǎn),訓(xùn)練時(shí)使用的數(shù)據(jù)集主要來(lái)自互聯(lián)網(wǎng),在通用知識(shí)和領(lǐng)域知識(shí)的分布上存在不均,會(huì)影響其在具體行業(yè)的應(yīng)用?!?/p>
舉個(gè)例子,在浪潮信息服務(wù)所面臨的主要客戶(hù)問(wèn)題,包括咨詢(xún)和故障報(bào)修兩大類(lèi):前者如各類(lèi)的產(chǎn)品服務(wù)政策、設(shè)備使用、以及復(fù)雜的技術(shù)咨詢(xún),如技術(shù)咨詢(xún)方面其實(shí)比較常見(jiàn)的是如何做系統(tǒng)安裝、Raid配置等,因?yàn)檫@個(gè)過(guò)程比較復(fù)雜,常出現(xiàn)各種問(wèn)題;產(chǎn)品咨詢(xún)包括購(gòu)買(mǎi)產(chǎn)品的內(nèi)存配置、保修時(shí)長(zhǎng)等等;故障報(bào)修相對(duì)會(huì)比較有針對(duì)性、更多元,例如無(wú)法開(kāi)機(jī)、硬盤(pán)故障、內(nèi)存故障等等。
在浪潮信息的咨詢(xún)客戶(hù)中,有80%的用戶(hù)為非專(zhuān)業(yè)工程師,智能客服需要在準(zhǔn)確理解用戶(hù)、精準(zhǔn)定義問(wèn)題的基礎(chǔ)上,通過(guò)多輪回答解決技術(shù)問(wèn)題,給予客戶(hù)滿(mǎn)意的答案。對(duì)于客戶(hù)而言,如若智能客服所給予的答案過(guò)于標(biāo)準(zhǔn)和冗余,卻無(wú)法快速幫客戶(hù)解決具體問(wèn)題,客服所給予的答案只可被定義為對(duì)的答案而不是好的答案。
實(shí)際上,浪潮信息從4、5年前就開(kāi)始進(jìn)行客服的數(shù)字化轉(zhuǎn)型和探索,并且在2019年開(kāi)始著手應(yīng)用業(yè)內(nèi)在探索的FAQ、任務(wù)式對(duì)話(huà)、知識(shí)圖譜等NLP領(lǐng)域相關(guān)技術(shù),對(duì)客服系統(tǒng)進(jìn)行了一定程度的改造和提升。
但當(dāng)時(shí)遇到的瓶頸也十分明顯,主要在于兩方面:“一是企業(yè)產(chǎn)品信息更新快,造成模型訓(xùn)練任務(wù)非常大,加之模型知識(shí)庫(kù)的封閉,在訓(xùn)練效果上也受到制約;二是機(jī)器人需要對(duì)上下文結(jié)合語(yǔ)境進(jìn)行語(yǔ)義理解,引導(dǎo)客戶(hù)提問(wèn)并且精準(zhǔn)識(shí)別問(wèn)題,在專(zhuān)業(yè)知識(shí)領(lǐng)域的IT行業(yè),難度非常高?!崩顺毙畔⒎?wù)與實(shí)施部總監(jiān)陳彬指出。
除了在大模型的落地中引入領(lǐng)域知識(shí)外,浪潮智能客服在研發(fā)過(guò)程中還重點(diǎn)考慮了其他幾點(diǎn)因素:
第一,客服系統(tǒng)是不是真正地理解客戶(hù),是否能夠通過(guò)多次對(duì)話(huà)了解到客戶(hù)真實(shí)的服務(wù)意圖。企業(yè)級(jí)場(chǎng)景中,客戶(hù)有個(gè)報(bào)修問(wèn)題,但無(wú)法用專(zhuān)業(yè)的技術(shù)語(yǔ)言對(duì)服務(wù)場(chǎng)景進(jìn)行準(zhǔn)確描述時(shí),就非常考驗(yàn)客服系統(tǒng)的理解能力。
第二,是否需要投入額外和高昂的人力成本讓客服機(jī)器人具備自主學(xué)習(xí)、迭代的能力。讓專(zhuān)業(yè)工程師做重復(fù)的模型訓(xùn)練工作,既不符合企業(yè)成本要求,也不符合企業(yè)建設(shè)專(zhuān)家型團(tuán)隊(duì)的長(zhǎng)期規(guī)劃。
第三,B端客戶(hù)對(duì)企業(yè)的服務(wù)體驗(yàn)、服務(wù)口碑要求高,訓(xùn)練出的客服系統(tǒng)是否能夠讓更多的客戶(hù)接受、信任并滿(mǎn)意地使用。相較于傳統(tǒng)的智能客服采用多模型、多數(shù)據(jù)庫(kù)的架構(gòu),浪潮信息智能客服系統(tǒng)最終實(shí)現(xiàn)統(tǒng)一架構(gòu)支持多任務(wù)解決問(wèn)題。而此前完成一套客服動(dòng)作,往往涉及FAQ、任務(wù)式知識(shí)圖譜、知識(shí)檢索等模塊,需要在多個(gè)知識(shí)庫(kù)、模型之間進(jìn)行任務(wù)調(diào)度,架構(gòu)復(fù)雜且維護(hù)難度比較大。
此外,由于在模型訓(xùn)練上實(shí)現(xiàn)了自進(jìn)化、快進(jìn)化學(xué)習(xí),而不是原有需要人工或半人工搭建和訓(xùn)練模型的過(guò)程,在人工標(biāo)注和訓(xùn)練成本上得到了極大降低。
從浪潮信息數(shù)據(jù)中心服務(wù)的成效來(lái)看,在應(yīng)用智能客服系統(tǒng)后,客戶(hù)問(wèn)答的匹配率(即覆蓋率)達(dá)到92%,對(duì)常見(jiàn)的復(fù)雜問(wèn)題的解決率目前能達(dá)到80%以上,平均解決率是65%左右。此外,服務(wù)整體人員規(guī)模占浪潮信息總?cè)藛T規(guī)模的4%,而業(yè)內(nèi)一般都占比15%到20%左右,在整體人均效能上得到了一定提升。
“服務(wù)作為一個(gè)公司的重要窗口業(yè)務(wù)部門(mén),也是和客戶(hù)交互最緊密的平臺(tái)。所以我們首先考慮的是怎么把實(shí)際業(yè)務(wù)和AI算法結(jié)合在一起。本身IT的服務(wù)場(chǎng)景非常復(fù)雜,且面對(duì)是更多大量的B類(lèi)客戶(hù),我們當(dāng)初也在討論,是否真的需要花這么大的精力,把傳統(tǒng)的服務(wù)場(chǎng)景,做AI的相關(guān)技術(shù)和算法的落地,在項(xiàng)目初期也是比較有爭(zhēng)議的?!标惐虮硎?。
但從目前取得的成效來(lái)看,當(dāng)初的投入是值得的。
結(jié)合鈦媒體的觀察,客服機(jī)器人的背后仍是復(fù)雜的AI技術(shù)棧作為支撐。涉及語(yǔ)音識(shí)別、語(yǔ)義理解和生成、人機(jī)交互等等,存在系統(tǒng)搭建成本較高。如AI的邊際成本,模型訓(xùn)練中對(duì)人工標(biāo)注數(shù)據(jù)的成本,加之企業(yè)多數(shù)存在二次開(kāi)發(fā)的定制化要求,導(dǎo)致部署交付成本也難以避免。
企業(yè)對(duì)技術(shù)的投入和成熟與否直接決定了體驗(yàn)的高低,而如今浪潮AI大模型“源”在智能客服場(chǎng)景的實(shí)際落地應(yīng)用,為業(yè)界提供了一種另一種可參考的解決方案。
(本文首發(fā)鈦媒體APP 作者 | 楊麗)