案例名稱
九章云極DataCanvas助力某銀行構(gòu)建開源算法平臺(tái)
案例簡介
(相關(guān)資料圖)
在實(shí)現(xiàn)金融科技智能化戰(zhàn)略的過程中,某銀行構(gòu)建了各類AI能力,如NLP、OCR、語音識(shí)別等,但也隨之出現(xiàn)了一些問題,包括:平臺(tái)算法黑盒、基礎(chǔ)算力資源管理分散、缺少統(tǒng)一的模型部署管理平臺(tái)來納管異構(gòu)模型。在本項(xiàng)目中,基于開源組件和白盒算子庫搭建企業(yè)級開源算法開發(fā)平臺(tái)。為全行分析及建模人員提供“練兵場”,為自研、創(chuàng)新提供孵化環(huán)境,支持多種常用的開源框架模型的統(tǒng)一納管和發(fā)布?;谛袃?nèi)k8s部署平臺(tái),將訓(xùn)練環(huán)境和預(yù)估環(huán)境隔離,實(shí)現(xiàn)計(jì)算資源統(tǒng)一管理、GPU/CPU的統(tǒng)一調(diào)度,同時(shí)實(shí)現(xiàn)了AI應(yīng)用的統(tǒng)一監(jiān)控。
創(chuàng)新技術(shù)/模式應(yīng)用
搭建開源算法平臺(tái):開源算法是銀行數(shù)字化轉(zhuǎn)型的重要工具,可以提高技術(shù)創(chuàng)新能力,降低研發(fā)成本,提高數(shù)據(jù)處理和分析能力,增強(qiáng)自主可控能力。但是開源算法在使用中會(huì)碰到很多問題,例如算法質(zhì)量問題,由于開源算法的開放性,任何人都可以對其進(jìn)行修改和補(bǔ)充,因此算法的質(zhì)量參差不齊,有些可能存在缺陷或漏洞;維護(hù)和更新問題,開源算法的代碼是公開的,但是銀行在使用過程中仍然需要進(jìn)行一定的維護(hù)和更新,這需要一定的技術(shù)支持和人力成本。本次項(xiàng)目,通過搭建開源算法平臺(tái),使得銀行更加安全、高效地使用開源算法。開源算法平臺(tái)提供的主要能力有:
統(tǒng)一的開源算法庫
銀行需要根據(jù)實(shí)際業(yè)務(wù)需求選擇適用的開源算法,需要考慮算法的性能、可擴(kuò)展性、開發(fā)難度、文檔資料豐富程度等因素,平臺(tái)根據(jù)行方的應(yīng)用場景需求,對現(xiàn)在比較成熟和廣泛使用的算法框架,例如Scikit-learn、TensorFlow、Keras、PyTorch等進(jìn)行了二次開發(fā)和優(yōu)化,實(shí)現(xiàn)了不同框架算法的統(tǒng)一納管和發(fā)布,使得行方的調(diào)用更加高效。
開源算法統(tǒng)一調(diào)度
平臺(tái)實(shí)現(xiàn)了多算法框架的統(tǒng)一編排調(diào)度,解決了不同算法框架的接口兼容、分布式計(jì)算、資源管理和運(yùn)行環(huán)境等多個(gè)方面的問題,實(shí)現(xiàn)了內(nèi)存、GPU、CPU等計(jì)算資源的統(tǒng)一管理和調(diào)度,實(shí)現(xiàn)更加高效和準(zhǔn)確的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)。
自動(dòng)化測試和部署
模型的測試和部署是制約應(yīng)用場景落地的重要因素,平臺(tái)實(shí)現(xiàn)了開源算法模型的自動(dòng)化測試和部署,集成測試框架,能夠?qū)崿F(xiàn)模型的快速驗(yàn)證;使用容器化技術(shù),將模型文件和依賴自動(dòng)打包成一個(gè)鏡像,實(shí)現(xiàn)自動(dòng)部署,并持續(xù)監(jiān)控與優(yōu)化,能夠跟蹤算法模型的精度、速度和可靠性等指標(biāo),使得建模人員能夠根據(jù)監(jiān)控?cái)?shù)據(jù)進(jìn)行調(diào)整和優(yōu)化。
項(xiàng)目效果評估
銀行業(yè)務(wù)需要大量的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)來實(shí)現(xiàn)風(fēng)險(xiǎn)控制、客戶營銷、業(yè)務(wù)決策等目標(biāo)。通過使用開源算法平臺(tái),銀行可以實(shí)現(xiàn)多算法框架的統(tǒng)一編排調(diào)度,從而提高數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的效率,減少冗余工作和人工錯(cuò)誤,提高數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的準(zhǔn)確性。在項(xiàng)目期間,平臺(tái)快速響應(yīng)各業(yè)務(wù)的創(chuàng)新需求,實(shí)現(xiàn)了各種業(yè)務(wù)場景:
鄰近網(wǎng)點(diǎn)識(shí)別
為進(jìn)一步提升客戶服務(wù)體驗(yàn),需根據(jù)客戶已留存的地址數(shù)據(jù)信息,實(shí)現(xiàn)對于每位客戶與其最近網(wǎng)點(diǎn)之間的匹配,并將結(jié)果落實(shí)成數(shù)據(jù)標(biāo)簽。后續(xù)通過數(shù)據(jù)應(yīng)用為客戶提供更為貼心的網(wǎng)點(diǎn)服務(wù)及更加精準(zhǔn)的產(chǎn)品營銷,從而提升客戶網(wǎng)點(diǎn)到店率及交易活躍度。
數(shù)據(jù)自動(dòng)化對標(biāo)
對數(shù)據(jù)管理系統(tǒng)中數(shù)據(jù)標(biāo)準(zhǔn)對標(biāo)管理流程優(yōu)化,通過NLP技術(shù)輔助業(yè)務(wù)在數(shù)管系統(tǒng)中進(jìn)行數(shù)據(jù)對標(biāo),減輕業(yè)務(wù)對標(biāo)工作量。
事件知識(shí)庫
目前數(shù)據(jù)中心的知識(shí)庫主要以手冊形式,包括故障處理手冊、系統(tǒng)排查手冊等。但隨著行方業(yè)務(wù)的持續(xù)增長,以及信息系統(tǒng)的持續(xù)上線,以手冊保存數(shù)據(jù)中心知識(shí)的形式已不滿足當(dāng)下的需求。行方急需建設(shè)一個(gè)輕流程的通過事件自動(dòng)獲取知識(shí)的能力,通過NLP模型自動(dòng)獲取有效的知識(shí),并通過評價(jià)體系來實(shí)現(xiàn)知識(shí)的更新迭代,持續(xù)的提升數(shù)據(jù)中心知識(shí)庫建設(shè)的能力。
信用卡智能批額
通過接入客戶的內(nèi)外部數(shù)據(jù),例如客戶的個(gè)人信息、歷史信用卡使用記錄、個(gè)人財(cái)務(wù)狀況、征信數(shù)據(jù)等,構(gòu)建信用卡額度智能決策模型,實(shí)現(xiàn)信用卡額度的自動(dòng)審批,在符合風(fēng)控要求的基礎(chǔ)上,提高用戶體驗(yàn)。
開源算法平臺(tái)全面賦能行內(nèi)的智能化場景,通過開源算法平臺(tái),行方降低開源算法的使用運(yùn)維成本、提高創(chuàng)新能力、增強(qiáng)靈活性和可定制性、提高安全性和可靠性,同時(shí)也促進(jìn)了合作與共享,推進(jìn)了銀行金融科技智能化戰(zhàn)略的進(jìn)程。
項(xiàng)目牽頭人
王申 銀行BU總經(jīng)理
關(guān)鍵詞: