Grid是一個尚無完全成型的,分佈於全球範圍之內的人工智能基礎設施,它不是一個單獨的實體,而是由數量可觀的分散的計算節點,再加上數據源,以及經由標準化協議互聯而構成網絡的模型所組成的,它的核心價值乃將全球各處的算力和數據資源進行聚合,從而達成超大規模AI模型的協同訓練以及推理,並且保障數據隱私與主權,理解這一概念,關鍵之處在於掌握其“連接”與“協同”的本質。

究竟什麼才是,被稱作Grid的這種事物的,核心架構呢。

Grid的架構,是構建於分層以及去中心化的理念之上的。物理層會這樣構成,它有著遍布全球的數據中心,還有邊緣計算設備以及終端設備,其作用是提供基礎算力。協議層它包含一系列開放標準,這些標準用於定義數據交換格式,還有模型拆分與聚合方法,另外還有任務調度機制以及資源貢獻的激勵機制,而這是實現互操作性的關鍵所在。

那架構的最頂層部分呢,是應用與服務層,各種各樣的AI應用憑藉調用網格資源去得以運行,這樣的一種設計致使任何的組織或者個人能夠貢獻閒置的算力或者專有數據模型,並且還能從那個網格里獲取自身所需要的AI能力,拿一家醫院而言,可以在不進行原始患者數據共享的情況之下,借助網格訓練打造出一個高精度的疾病診斷模型,而這個模型的訓練過程實際上是在全球多個符合要求的計算節點上分散完成的。

全球神經網絡網格,是藉助怎樣的方式,來確保數據隱私以及安全得以保障的呢?

構成Grid得以推廣的基礎是數據隱私,它主要藉助像聯邦學習、同態加密以及差分隱私等前沿技術來達成,在聯邦學習框架裡,數據不用離開本地境地,只是模型的參數更新(梯度)經加密後被送往中央服務器加以聚合,進而經由這種方式根本地規避掉原始數據的洩露風險了。

每一次數據訪問以及模型使用,會藉由區塊​​鏈技術或者可信執行環境予以記錄和驗證,用以確保計算過程具備可審計性以及不可篡改特性。網格會設置較為嚴格的數據主權規則,明確指出數據貢獻者對其自己的數據握有完全控制權,能夠隨時將訪問權限撤銷。這樣的設計致使不同司法管轄區、擁有敏感數據的企業得以安心地參與網格協作。

全球神經網絡網格,對於人工智能模型訓練,具備怎樣的優勢呢?

它最為突出顯著的優勢在於能夠衝破單個機構於算力以及數據規模方面所存在的瓶頸,傳統情況下,去訓練一個擁有千億級參數的模型往往需要進行集中式採購以及維護數量眾多的海量GPU集群,這樣一來成本是極為高昂的,然而在網格當中,訓練的任務能夠被分解開來,然後調度到全球範圍之內最為適配的節點之上進行並行計算,如此便極大程度地降低了單一實體的投入門檻。

在數據多樣性方面,存在著另一個關鍵優勢,網格可接入各處不同地域數據源,可接入各個不同領域數據源,還能接入各種不同模態數據源,這對訓練通用人工智能模型有幫助,能促使訓練出偏見更少的通用人工智能模型,也能訓練出泛化能力更強的通用人工智能模型,拿自然語言處理模型來說,要是它能同時學習來自亞洲的語料和語境,能同時學習來自歐洲的語料和語境,又能同時學習來自非洲的語料和語境,那麼這個自然語言處理模型的理解能力會遠勝於僅基於單一語言文化數據訓練的模型,其生成能力同樣會遠勝於僅基於單一語言文化數據訓練的模型。

企業怎樣去接入,然後如何來使用Grid,是這樣的情況,這是一個問題。

企業接入網格,一般是從起始評估自身的資源以及需求著手。要是企業有著高質量的專有數據,或者存在閒置的算力,那麼能夠註冊成為資源貢獻者,藉由網格平台所提供的軟件開發套件,把本地系統和網格協議進行對接。作為一種回報,企業能夠獲取網格代幣,或者直接去換取所需的AI 服務額度。

更直接的接入方式面向需求方。企業開發者憑藉網格給出的API接口,提交AI訓練或推理任務,如同調用雲計算服務一般。網格會自行匹配最優資源,而後返回結果。起初,企業能夠選擇從某些非核心業務場景著手嘗試,比如客戶服務聊天機器人的優化、供應鏈預測分析等事項,在熟悉流程以及效果之後,再逐漸應用到核心研發領域當中。

Grid所面臨的主要方面的挑戰究竟是什麼呢,是哪一些挑戰屬於主要的呢,主要挑戰到底是怎樣的情況呢?

在技​​術層面,首當其衝面臨著挑戰​​,這挑戰涵蓋了異構算力的高效調度,跨網絡延遲需要得到優化,存在著不同加密技術帶來的額外計算開銷。對於如何去設計一個公平、透明以及可持續來支撐的激勵機制,目的乃是吸引並且留住全球參與者,這是一個複雜的經濟學與博弈論方面的問題,當前仍然正處於探索的進程之中。

法規跟治理屬於另類大挑戰,因網格跨越國界,所以它得應對不同國家於數據跨境流動、人工智能倫理、數字資產等層面的法律法規差異,構建一個全球都認可的治理框架以及爭端解決機制相當關鍵,而這需要技術社群、各個國家政府、國際組織等諸多利益相關者展開深入對話與合作。

全球神經網絡網格的往後發展趨向,全球神經網絡網格的後續發展走向,全球神經網絡網格的將來發展態勢。

從短期方面來看, Grid會率先於科研機構、開源社區以及特定行業聯盟的範圍之內,構建起幾個規模相對較大的子網格。這些子網格會著重聚焦在像生物醫藥發現、氣候預測這類對於算力以及數據有著極高要求的垂直領域,憑藉實踐持續不斷地完善技術與協作模式。

從長遠來看,伴隨底層技術走向成熟且全球數字治理規則漸漸協調,各個子網格有希望實現互聯互通,最終塑造出一個名副其實的全球性網絡。到那個時候,獲取AI能力會如同當下獲取電力或者連接互聯網那般便捷且普惠,極大地促使各行各業的智能化轉型加速推進,並且有可能催生出我們現在根本想像不到的全新應用形態以及服務模式。

你能不能覺得,於Grid的發展進程裡,技術融合方面的障礙以及全球治理範疇的難題,究竟哪一個會早一些達成突破性的進展呢?歡迎在評論區域分享你的看法見解,要是感覺這篇文章是有幫助作用的,請點個贊並且分享給更多有興趣的朋友呀?

Posted in

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *