科技改變生活 · 科技引領(lǐng)未來
人工智能時代 , 存在的最大問題是是魚和熊掌不可兼得 , 也就是隱私性和可用性難以兼顧。如果你想要 AI 本身系統(tǒng)發(fā)揮作用 , 就可能要先犧牲隱私 , 但在大量的真實場景當中 , 如果不能同時兼顧到隱私性和可用性 , 會導致很多 AI 落地的困境。
比如舉一個貸款風控的例子。如果用戶想要去銀行做貸款 , 先來到了銀行 A, 銀行 A 基于一些本地數(shù)據(jù)判斷這個 A 是一個壞人 , 我們不可以給他貸款 , 這個人就到了銀行 B, 但是銀行 B 沒有銀行 A 的這些數(shù)據(jù) , 所以銀行 B 也許會把這筆貸款發(fā)放給用戶本人。這些由數(shù)據(jù)不流通所導致的矛盾比比皆是。
為了解決這一問題 , 國內(nèi)外不少科技公司先后推出了解決方案 , 比如谷歌推出的聯(lián)邦學習、螞蟻金服提出的共享智能等。
共享智能為什么能夠獲得產(chǎn)學研各界的廣泛關(guān)注?
近年來 , 隨著隱私保護越來越受重視 , 相關(guān)法規(guī)逐漸出臺 , 互聯(lián)網(wǎng)公司難以任意的獲得數(shù)據(jù) ; 但在另一方面 , 基于大數(shù)據(jù)的人工智能需要更多更完善的數(shù)據(jù)才能發(fā)揮更大的作用。就像上面所提到的例子一樣 , 如何在保護隱私和數(shù)據(jù)安全的前提下 , 聯(lián)合多方數(shù)據(jù)進行 AI 訓練和分析 , 成為學術(shù)界和產(chǎn)業(yè)界的研發(fā)熱點。
螞蟻共享智能作為一個新興的交叉學科 , 近些年獲得了學術(shù)界、產(chǎn)業(yè)界以及研究機構(gòu)的廣泛關(guān)注。數(shù)據(jù)已經(jīng)是一種生產(chǎn)要素 , 重要性不言而喻。數(shù)據(jù)不僅是各類大數(shù)據(jù)應用的基礎(chǔ) ; 數(shù)據(jù)的質(zhì)量和數(shù)量也已經(jīng)成為影響人工智能模型效果最重要的因素之一。當今各種應用產(chǎn)生并收集了大量的數(shù)據(jù) , 同時也是使用數(shù)據(jù)的大戶。隨著 AI 模型能力和算力的提升 , 各種應用場景對各種異構(gòu)、異源數(shù)據(jù)的使用效率也在飛速提升。
然而 , 數(shù)據(jù)的廣泛使用在提升應用效果的同時也引發(fā)了我們對于數(shù)據(jù)安全性的擔憂。這主要是歸結(jié)于數(shù)據(jù)自身的兩個很重要的特性 : 一個是可復制性 , 一個是可復用性。可復制是指 , 數(shù)據(jù)可以被完整的、極低成本的拷貝 ; 可復用性是指 , 某份數(shù)據(jù)可以被多個不同領(lǐng)域的場景復用 , 也可以在相對長的一個時間軸上被復用。
所以如果不同應用之間直接共享數(shù)據(jù) , 那么可復制性和可復用性 , 一定會導致數(shù)據(jù)泄露的情況 , 也就是被留存二次使用 , 從而侵犯了商業(yè)利益。更為嚴重的是 , 如果是個人相關(guān)的數(shù)據(jù) , 很多時候 , 數(shù)據(jù)的管理者和使用者并不是數(shù)據(jù)的所有者。一旦在數(shù)據(jù)共享的過程中 , 發(fā)生了數(shù)據(jù)泄露 , 被對方濫用 , 那數(shù)據(jù)的管理者不僅僅是商業(yè)利益受到侵犯 , 它很可能也沒有盡到數(shù)據(jù)管理的責任。從歐盟的 GDPR 開始 , 到美國 CCPA, 到中國的數(shù)據(jù)安全法、網(wǎng)絡安全法、個人信息保護法都對這種數(shù)據(jù)管理失責 , 和數(shù)據(jù)濫用 , 提出了嚴格的規(guī)范。所以各大數(shù)據(jù)方 , 出于保護商業(yè)利益、法律風險、輿論風險各方面考慮 , 都在收緊數(shù)據(jù)共享 , 從而形成了大數(shù)據(jù)孤島。
螞蟻共享智能就是為解決數(shù)據(jù)協(xié)作需求與隱私泄露和數(shù)據(jù)濫用之間矛盾的技術(shù)解決方案 , 不直接共享數(shù)據(jù)的情況下 , 連通大數(shù)據(jù)孤島 , 實現(xiàn)多方數(shù)據(jù)可用不可得 , 也就是拿不走 , 看不見 , 但是用得好。
共享智能憑什么可以成為國際標準?
早在 2016 年 , 螞蟻就開始致力于共享智能的技術(shù)研發(fā) , 并在螞蟻內(nèi)部及合作伙伴方的智能信貸、智能風控等業(yè)務領(lǐng)域中率先應用。螞蟻共享智能具有以下特點 :
(1)多種安全計算引擎整合 , 可基于不同業(yè)務場景來選擇合適的安全技術(shù)。既有基于 TEE 的集中式解決方案 , 也有基于 MPC 的分布式解決方案 ; 既可滿足數(shù)據(jù)水平切分的場景 , 也能解決數(shù)據(jù)垂直切分的訴求 ; 既可以做模型的訓練預測 , 也可以做數(shù)據(jù)的探查和分析。
(2)支持基于 SQL 語法的數(shù)據(jù)分析、各種數(shù)據(jù)預處理算子和多種機器學習算法。支持的算法包括但不限于 LR,GBDT,Xgboost,DNN,CNN,RNN,GNN 等。
(3)大規(guī)模集群化。支持大規(guī)模集群化 , 提供金融級的高效、穩(wěn)定、系統(tǒng)化的支撐。
值得一提的是 , 共享智能有四個基石性的研究方向 , 分別是多方安全計算 , 可信執(zhí)行環(huán)境 , 差分隱私 , 以及聯(lián)邦學習。
多方安全計算和可信執(zhí)行環(huán)境側(cè)重解決計算過程中的數(shù)據(jù)安全問題 , 差分隱私側(cè)重保護計算結(jié)果里的隱私泄露 , 而聯(lián)邦學習擅長解決大數(shù)據(jù)孤島帶來的人工智能算法收斂性及效率問題。單獨的一個方向并不能解決多方數(shù)據(jù)可用不可得的問題 , 共享智能的研究既包括推動這四個基礎(chǔ)方向的進步 , 又包括對這四個方向的融合創(chuàng)新 , 從而提供滿足不同實際需求的多種產(chǎn)品與服務。
這些技術(shù)在實踐中表現(xiàn)出了獨特的優(yōu)勢 , 可以應用于不同場景。比如基于可信執(zhí)行環(huán)境的方案可以做中心化部署 , 用戶的接入成本是比較低 ; 而基于多方安全計算的方案 , 相關(guān)的安全技術(shù)對用戶來說是透明的 , 給用戶的安全體感強。同時 , 多種技術(shù)并不是隔離的 , 在面對一個復雜問題的時候 , 對技術(shù)的選型不是非此即彼的關(guān)系 , 把不同的技術(shù)融合到一起 , 發(fā)揮各自技術(shù)的優(yōu)勢 , 往往會達到一個更為理想的效果。
不久前 , 螞蟻牽頭的共享智能聯(lián)盟標準就在 AIIA(中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟)正式發(fā)布 , 這也是全國首個共享智能的聯(lián)盟標準。事實上 , 早在 2019 年 , 共享智能就已經(jīng)亮相國際舞臺。螞蟻在 IEEE(電氣和電子工程師協(xié)會)、ITU-T(國際電信聯(lián)盟)中牽頭推進 “共享學習技術(shù)框架和技術(shù)要求”和 “共享學習系統(tǒng)技術(shù)框架”國際標準的制定 , 來解決行業(yè)痛點 , 讓數(shù)據(jù)在安全環(huán)境下進行連接、合作、共創(chuàng)、賦能 , 充分釋放多方數(shù)據(jù)價值。
共享智能技術(shù)在行業(yè)內(nèi) , 也獲得了一些行業(yè)獎項 , 體現(xiàn)了行業(yè)內(nèi)對這一技術(shù)的認可度。2019 年 , 在中國人工智能峰會上獲得了紫金產(chǎn)品創(chuàng)新獎 , 在全球人工智能創(chuàng)業(yè)者大會上獲得應用案例示范獎 , 在的世界人工智能產(chǎn)業(yè)安全上獲得了十大創(chuàng)新實踐 , 在 CCF(中國計算機學會), 獲得了科技進步優(yōu)秀獎。
標準是創(chuàng)新也是前瞻 , 不僅解決當前的問題 , 也能解決未來的問題。作為一家致力于為世界帶來平等普惠金融服務的科技公司 , 螞蟻金服一直走在國內(nèi)外標準制定的前列 , 助力推動技術(shù)的規(guī)范化發(fā)展。
螞蟻共享智能的應用實踐
金融行業(yè)作為一個數(shù)據(jù)驅(qū)動的行業(yè) , 不僅對數(shù)據(jù)的管控更嚴格 , 對數(shù)據(jù)的隱私保護也會更加重視 , 因此也是最需要通過技術(shù)手段解決數(shù)據(jù)孤島問題的行業(yè) , 這也是很多技術(shù)實踐都優(yōu)先選擇落地金融領(lǐng)域的原因。而螞蟻共享智能就憑借多年金融實踐和廣泛應用 , 獨樹一幟 , 成功幫助金融等相關(guān)行業(yè)逐步解決隱私泄露和數(shù)據(jù)濫用的數(shù)據(jù)共享難題 , 為大數(shù)據(jù)在更多領(lǐng)域的深度應用保駕護航。
接下來分享三個典型落地案例。
一個是在安全風控領(lǐng)域 , 螞蟻基于共享智能技術(shù)將風控能力賦能合作伙伴 , 聯(lián)合數(shù)據(jù)建模提升模型性能 , 來建立安全風控網(wǎng)絡。生態(tài)伙伴可以使用可信執(zhí)行環(huán)境技術(shù) , 把數(shù)據(jù)加密傳輸?shù)骄W(wǎng)絡中共建這個模型 , 打擊虛假交易、團伙作案等 , 大幅度提升風控準確率 , 實現(xiàn)風控網(wǎng)絡的凈化。通過這樣的風控網(wǎng)絡平臺 , 使得商家每天新增很多的交易 , 同時降低資損。
第二個是中和農(nóng)信 , 螞蟻通過數(shù)據(jù)融合大幅度提高風控性能 , 把原來傳統(tǒng)的線下模式 , 變成線上自動過審模式 , 完成授信只需 5 分鐘 , 8 個月累計放款 31.9 億 , 授信成功人數(shù) 44 萬人 , 業(yè)務覆蓋 20 + 省區(qū) , 300 + 縣城 , 10000 + 個鄉(xiāng)村 , 助力實現(xiàn)農(nóng)村普惠金融。
第三個是與江蘇銀行建立信貸聯(lián)合風控機制 , 通過共享智能技術(shù) , 構(gòu)建共同的模型強化風控管理 , 讓信貸防控的效果進一步提升。基于聯(lián)合風控機制 , 江蘇銀行能夠在獲得貸款申請后 , 通過數(shù)據(jù)交互 , 依據(jù)多方數(shù)據(jù)進行更科學的信貸決策 , 在這個過程中 , 用戶的數(shù)據(jù)和隱私也得到了有效的保護。在螞蟻共享智能等前沿技術(shù)加持下 , 江蘇銀行通過聯(lián)合風控系統(tǒng) , 提升綜合服務、智慧風控能力 , 破解信貸難題 , 在實現(xiàn)風險抵御能力增強的同時 , 推動業(yè)務穩(wěn)步增長 , 資產(chǎn)質(zhì)量持續(xù)改善。
總的來說 , 螞蟻希望構(gòu)建開放的共享智能網(wǎng)絡 , 有更多的伙伴、機構(gòu)參與進來 , 一起完成建設 , 打破數(shù)據(jù)孤島 , 助力 AI 技術(shù)更好的落地和應用。
何龍林
版權(quán)所有 未經(jīng)許可不得轉(zhuǎn)載
增值電信業(yè)務經(jīng)營許可證備案號:遼ICP備14006349號
網(wǎng)站介紹 商務合作 免責聲明 - html - txt - xml