案例名稱
九章云極DataCanvas助力某銀行構(gòu)建開源算法平臺
案例簡介
(相關資料圖)
在實現(xiàn)金融科技智能化戰(zhàn)略的過程中,某銀行構(gòu)建了各類AI能力,如NLP、OCR、語音識別等,但也隨之出現(xiàn)了一些問題,包括:平臺算法黑盒、基礎算力資源管理分散、缺少統(tǒng)一的模型部署管理平臺來納管異構(gòu)模型。在本項目中,基于開源組件和白盒算子庫搭建企業(yè)級開源算法開發(fā)平臺。為全行分析及建模人員提供“練兵場”,為自研、創(chuàng)新提供孵化環(huán)境,支持多種常用的開源框架模型的統(tǒng)一納管和發(fā)布?;谛袃?nèi)k8s部署平臺,將訓練環(huán)境和預估環(huán)境隔離,實現(xiàn)計算資源統(tǒng)一管理、GPU/CPU的統(tǒng)一調(diào)度,同時實現(xiàn)了AI應用的統(tǒng)一監(jiān)控。
創(chuàng)新技術/模式應用
搭建開源算法平臺:開源算法是銀行數(shù)字化轉(zhuǎn)型的重要工具,可以提高技術創(chuàng)新能力,降低研發(fā)成本,提高數(shù)據(jù)處理和分析能力,增強自主可控能力。但是開源算法在使用中會碰到很多問題,例如算法質(zhì)量問題,由于開源算法的開放性,任何人都可以對其進行修改和補充,因此算法的質(zhì)量參差不齊,有些可能存在缺陷或漏洞;維護和更新問題,開源算法的代碼是公開的,但是銀行在使用過程中仍然需要進行一定的維護和更新,這需要一定的技術支持和人力成本。本次項目,通過搭建開源算法平臺,使得銀行更加安全、高效地使用開源算法。開源算法平臺提供的主要能力有:
統(tǒng)一的開源算法庫
銀行需要根據(jù)實際業(yè)務需求選擇適用的開源算法,需要考慮算法的性能、可擴展性、開發(fā)難度、文檔資料豐富程度等因素,平臺根據(jù)行方的應用場景需求,對現(xiàn)在比較成熟和廣泛使用的算法框架,例如Scikit-learn、TensorFlow、Keras、PyTorch等進行了二次開發(fā)和優(yōu)化,實現(xiàn)了不同框架算法的統(tǒng)一納管和發(fā)布,使得行方的調(diào)用更加高效。
開源算法統(tǒng)一調(diào)度
平臺實現(xiàn)了多算法框架的統(tǒng)一編排調(diào)度,解決了不同算法框架的接口兼容、分布式計算、資源管理和運行環(huán)境等多個方面的問題,實現(xiàn)了內(nèi)存、GPU、CPU等計算資源的統(tǒng)一管理和調(diào)度,實現(xiàn)更加高效和準確的數(shù)據(jù)分析和機器學習。
自動化測試和部署
模型的測試和部署是制約應用場景落地的重要因素,平臺實現(xiàn)了開源算法模型的自動化測試和部署,集成測試框架,能夠?qū)崿F(xiàn)模型的快速驗證;使用容器化技術,將模型文件和依賴自動打包成一個鏡像,實現(xiàn)自動部署,并持續(xù)監(jiān)控與優(yōu)化,能夠跟蹤算法模型的精度、速度和可靠性等指標,使得建模人員能夠根據(jù)監(jiān)控數(shù)據(jù)進行調(diào)整和優(yōu)化。
項目效果評估
銀行業(yè)務需要大量的數(shù)據(jù)分析和機器學習來實現(xiàn)風險控制、客戶營銷、業(yè)務決策等目標。通過使用開源算法平臺,銀行可以實現(xiàn)多算法框架的統(tǒng)一編排調(diào)度,從而提高數(shù)據(jù)分析和機器學習的效率,減少冗余工作和人工錯誤,提高數(shù)據(jù)分析和機器學習的準確性。在項目期間,平臺快速響應各業(yè)務的創(chuàng)新需求,實現(xiàn)了各種業(yè)務場景:
鄰近網(wǎng)點識別
為進一步提升客戶服務體驗,需根據(jù)客戶已留存的地址數(shù)據(jù)信息,實現(xiàn)對于每位客戶與其最近網(wǎng)點之間的匹配,并將結(jié)果落實成數(shù)據(jù)標簽。后續(xù)通過數(shù)據(jù)應用為客戶提供更為貼心的網(wǎng)點服務及更加精準的產(chǎn)品營銷,從而提升客戶網(wǎng)點到店率及交易活躍度。
數(shù)據(jù)自動化對標
對數(shù)據(jù)管理系統(tǒng)中數(shù)據(jù)標準對標管理流程優(yōu)化,通過NLP技術輔助業(yè)務在數(shù)管系統(tǒng)中進行數(shù)據(jù)對標,減輕業(yè)務對標工作量。
事件知識庫
目前數(shù)據(jù)中心的知識庫主要以手冊形式,包括故障處理手冊、系統(tǒng)排查手冊等。但隨著行方業(yè)務的持續(xù)增長,以及信息系統(tǒng)的持續(xù)上線,以手冊保存數(shù)據(jù)中心知識的形式已不滿足當下的需求。行方急需建設一個輕流程的通過事件自動獲取知識的能力,通過NLP模型自動獲取有效的知識,并通過評價體系來實現(xiàn)知識的更新迭代,持續(xù)的提升數(shù)據(jù)中心知識庫建設的能力。
信用卡智能批額
通過接入客戶的內(nèi)外部數(shù)據(jù),例如客戶的個人信息、歷史信用卡使用記錄、個人財務狀況、征信數(shù)據(jù)等,構(gòu)建信用卡額度智能決策模型,實現(xiàn)信用卡額度的自動審批,在符合風控要求的基礎上,提高用戶體驗。
開源算法平臺全面賦能行內(nèi)的智能化場景,通過開源算法平臺,行方降低開源算法的使用運維成本、提高創(chuàng)新能力、增強靈活性和可定制性、提高安全性和可靠性,同時也促進了合作與共享,推進了銀行金融科技智能化戰(zhàn)略的進程。
項目牽頭人
王申 銀行BU總經(jīng)理
關鍵詞: