2018年至今,NLP領(lǐng)域經(jīng)歷了非常大的變化,Transformer、ELMO、BERT、GPT-3,再到最近的ChatGPT(GPT 3.5的微調(diào))的突破,NLP在預(yù)訓(xùn)練大模型的暴力拆解路上越走越遠,這也讓各行業(yè)開始相信:很多之前無法做到的場景、效果,現(xiàn)在可以有新的解法和落地。
智能客服,是NLP和深度學(xué)習(xí)技術(shù)落地的重要領(lǐng)域之一??头梢曰谔崆霸O(shè)定好的規(guī)則,對用戶意圖進行判斷并生成對應(yīng)的固定話術(shù)。文本機器人、外呼機器人,可以替代掉原有重復(fù)性比較強的人工動作,逐漸轉(zhuǎn)變?yōu)橄鄬θ粘5穆涞貓鼍?。比如你日常所接聽到的快遞客服電話,訂單咨詢的對話框等等,背后都有來自客服機器人的驅(qū)動。
但在對客服要求比較高的企業(yè)級場景中,對多輪對話理解用戶意圖和知識專業(yè)度要求較高,現(xiàn)有的客服機器人仍有很高提升的空間。
【資料圖】
一是系統(tǒng)整體搭建的維護成本比較高,效率比較低,因為大多數(shù)的企業(yè)級智能客服的知識庫不是流程化的,而是技術(shù)知識庫,需要人工/半自動的方式進行搭建。二是業(yè)務(wù)場景復(fù)雜,專門知識門檻會更高,往往會涉及不同客戶的應(yīng)用場景,與業(yè)務(wù)流程相關(guān)的復(fù)雜場景。三是持續(xù)突破比較難,邊際效益遞減明顯,一般在良好技術(shù)知識庫的支撐下,企業(yè)級智能客服的起步較快,但受制于方法論的影響,前期需要投入的大量人力、算力和數(shù)據(jù),而到一定階段則會陷入提升的瓶頸。
這樣的問題也曾經(jīng)困擾浪潮信息的客服系統(tǒng)研發(fā)人員。
近日,鈦媒體App對話浪潮信息服務(wù)總監(jiān)陳彬、浪潮信息AI軟件研發(fā)總監(jiān)吳韶華,圍繞智能客服市場當(dāng)前解決的難題,以AI大模型的實際落地應(yīng)用為視角,進行深入交流。
具體來講,浪潮信息以AI大模型“源”為智能引擎,和InService智能服務(wù)平臺,搭建出了“智能客服大腦”。
據(jù)介紹,“智能客服大腦”學(xué)習(xí)了2萬余份產(chǎn)品文檔和用戶手冊的數(shù)據(jù),并結(jié)合百萬條浪潮信息專家工程師服務(wù)對話、數(shù)十萬份日志、工單數(shù)據(jù)等算法訓(xùn)練,具備語言理解、數(shù)據(jù)分析、自主學(xué)習(xí)和智能推理等能力,支持自然語言交互服務(wù)、已授權(quán)IT設(shè)備的智能運維與診斷、以及備品備件等資源的智能管理和調(diào)度。
AI大模型在應(yīng)用過程中必然會面臨各個行業(yè)的應(yīng)用落地。在此之前,浪潮AI大模型“源”已經(jīng)在人機交互、知識檢索、語言翻譯、文學(xué)創(chuàng)作等領(lǐng)域有所應(yīng)用。
以大模型作為基礎(chǔ)能力,通過大模型的蒸餾實現(xiàn)相關(guān)的小模型,不僅實現(xiàn)的速度更快,智能化水平更高,從技術(shù)角度來講,大模型在落地過程中呈現(xiàn)出了與以往模型非常不同的技術(shù)特征,也帶來了更好的智能化水平。不論對大模型進行微調(diào),還是引入領(lǐng)域知識庫的方式,均是業(yè)界在探索的路徑。
在浪潮信息AI軟件研發(fā)總監(jiān)吳韶華看來,“大模型想要在某個方向上訓(xùn)練得更好,智能化水平更高,確實需要在具體落地場景引入額外的領(lǐng)域知識,才能解決實際問題。AI大模型有其自身特點,訓(xùn)練時使用的數(shù)據(jù)集主要來自互聯(lián)網(wǎng),在通用知識和領(lǐng)域知識的分布上存在不均,會影響其在具體行業(yè)的應(yīng)用?!?/p>
舉個例子,在浪潮信息服務(wù)所面臨的主要客戶問題,包括咨詢和故障報修兩大類:前者如各類的產(chǎn)品服務(wù)政策、設(shè)備使用、以及復(fù)雜的技術(shù)咨詢,如技術(shù)咨詢方面其實比較常見的是如何做系統(tǒng)安裝、Raid配置等,因為這個過程比較復(fù)雜,常出現(xiàn)各種問題;產(chǎn)品咨詢包括購買產(chǎn)品的內(nèi)存配置、保修時長等等;故障報修相對會比較有針對性、更多元,例如無法開機、硬盤故障、內(nèi)存故障等等。
在浪潮信息的咨詢客戶中,有80%的用戶為非專業(yè)工程師,智能客服需要在準(zhǔn)確理解用戶、精準(zhǔn)定義問題的基礎(chǔ)上,通過多輪回答解決技術(shù)問題,給予客戶滿意的答案。對于客戶而言,如若智能客服所給予的答案過于標(biāo)準(zhǔn)和冗余,卻無法快速幫客戶解決具體問題,客服所給予的答案只可被定義為對的答案而不是好的答案。
實際上,浪潮信息從4、5年前就開始進行客服的數(shù)字化轉(zhuǎn)型和探索,并且在2019年開始著手應(yīng)用業(yè)內(nèi)在探索的FAQ、任務(wù)式對話、知識圖譜等NLP領(lǐng)域相關(guān)技術(shù),對客服系統(tǒng)進行了一定程度的改造和提升。
但當(dāng)時遇到的瓶頸也十分明顯,主要在于兩方面:“一是企業(yè)產(chǎn)品信息更新快,造成模型訓(xùn)練任務(wù)非常大,加之模型知識庫的封閉,在訓(xùn)練效果上也受到制約;二是機器人需要對上下文結(jié)合語境進行語義理解,引導(dǎo)客戶提問并且精準(zhǔn)識別問題,在專業(yè)知識領(lǐng)域的IT行業(yè),難度非常高?!崩顺毙畔⒎?wù)與實施部總監(jiān)陳彬指出。
除了在大模型的落地中引入領(lǐng)域知識外,浪潮智能客服在研發(fā)過程中還重點考慮了其他幾點因素:
第一,客服系統(tǒng)是不是真正地理解客戶,是否能夠通過多次對話了解到客戶真實的服務(wù)意圖。企業(yè)級場景中,客戶有個報修問題,但無法用專業(yè)的技術(shù)語言對服務(wù)場景進行準(zhǔn)確描述時,就非常考驗客服系統(tǒng)的理解能力。
第二,是否需要投入額外和高昂的人力成本讓客服機器人具備自主學(xué)習(xí)、迭代的能力。讓專業(yè)工程師做重復(fù)的模型訓(xùn)練工作,既不符合企業(yè)成本要求,也不符合企業(yè)建設(shè)專家型團隊的長期規(guī)劃。
第三,B端客戶對企業(yè)的服務(wù)體驗、服務(wù)口碑要求高,訓(xùn)練出的客服系統(tǒng)是否能夠讓更多的客戶接受、信任并滿意地使用。相較于傳統(tǒng)的智能客服采用多模型、多數(shù)據(jù)庫的架構(gòu),浪潮信息智能客服系統(tǒng)最終實現(xiàn)統(tǒng)一架構(gòu)支持多任務(wù)解決問題。而此前完成一套客服動作,往往涉及FAQ、任務(wù)式知識圖譜、知識檢索等模塊,需要在多個知識庫、模型之間進行任務(wù)調(diào)度,架構(gòu)復(fù)雜且維護難度比較大。
此外,由于在模型訓(xùn)練上實現(xiàn)了自進化、快進化學(xué)習(xí),而不是原有需要人工或半人工搭建和訓(xùn)練模型的過程,在人工標(biāo)注和訓(xùn)練成本上得到了極大降低。
從浪潮信息數(shù)據(jù)中心服務(wù)的成效來看,在應(yīng)用智能客服系統(tǒng)后,客戶問答的匹配率(即覆蓋率)達到92%,對常見的復(fù)雜問題的解決率目前能達到80%以上,平均解決率是65%左右。此外,服務(wù)整體人員規(guī)模占浪潮信息總?cè)藛T規(guī)模的4%,而業(yè)內(nèi)一般都占比15%到20%左右,在整體人均效能上得到了一定提升。
“服務(wù)作為一個公司的重要窗口業(yè)務(wù)部門,也是和客戶交互最緊密的平臺。所以我們首先考慮的是怎么把實際業(yè)務(wù)和AI算法結(jié)合在一起。本身IT的服務(wù)場景非常復(fù)雜,且面對是更多大量的B類客戶,我們當(dāng)初也在討論,是否真的需要花這么大的精力,把傳統(tǒng)的服務(wù)場景,做AI的相關(guān)技術(shù)和算法的落地,在項目初期也是比較有爭議的。”陳彬表示。
但從目前取得的成效來看,當(dāng)初的投入是值得的。
結(jié)合鈦媒體的觀察,客服機器人的背后仍是復(fù)雜的AI技術(shù)棧作為支撐。涉及語音識別、語義理解和生成、人機交互等等,存在系統(tǒng)搭建成本較高。如AI的邊際成本,模型訓(xùn)練中對人工標(biāo)注數(shù)據(jù)的成本,加之企業(yè)多數(shù)存在二次開發(fā)的定制化要求,導(dǎo)致部署交付成本也難以避免。
企業(yè)對技術(shù)的投入和成熟與否直接決定了體驗的高低,而如今浪潮AI大模型“源”在智能客服場景的實際落地應(yīng)用,為業(yè)界提供了一種另一種可參考的解決方案。
(本文首發(fā)鈦媒體APP 作者 | 楊麗)