請回答 Web3.0 : 論「數據」打开的正確方式

2023-11-17 17:02 網易區塊鏈Chain


比如一個班級的身高體重,一家公司的雙十一業務情況,又比如一國的 GDP 及其趨勢——如果要問大家「數據」是什么?

想必所有人都能快速下出定義,還能隨手舉出一系列通俗易懂的例子。因此,可以說「數據」離我們很近,近到它本就由我們產生或發送,近到可以依靠它來指導我們的生活。

但它仿佛又離我們極遠,由手機、電腦收集正採集着大量有關個體的數據,或被簡化成滿屏的難以理解的 0 和 1,分散儲存在不爲人知的服務器裏;或被塞入天花亂墜的結構化術語,被制作成五顏六色的圖表。

作爲生產者的我們,對於數據的理解和掌控好像愈發困難了。

(圖源:swyftx)

爲了讓讀者更深入地了解這個概念,網易區塊鏈將开啓有關於 如何把握 Web3.0 時代下「數據」及未來趨勢的連載專欄,從多個角度深入挖掘數據邏輯,分析技術變革時期數據重要性提升的緣由,描摹最具價值數據的樣態,探尋攫取數據價值的多種場景。

數據是流動的,在不確定中找到確定性,是首期連載的目標所在。首篇論「數據」打开的正確方式,我們將討論 Web 3.0 時代翩躚而至,它能否帶領我們保護、理解甚至於重塑數據價值。

螺旋依舊,數據問題爭論不休

數據流轉的限度

數據存儲與用戶信息保護一直是用戶難以消解的隱憂。近年來,數據泄漏事件不斷消磨着用戶對於數據採集、存儲的信心。倘若用戶將隱私信息上傳中心化的存儲設施,便意味着喪失了對信息的掌控權。一旦這些隱私信息發生數據丟失、泄露或被盜用,對於個人來說便是一場“社會性死亡”。

自 2013 年以來,Facebook 至少已經發生了 5 起數據泄露事件。2019 年泄漏事件甚至波及了 5.4 億個账戶,Facebook 解釋稱泄漏的都是「舊數據」,不會就本次事件向用戶提出任何建議。

2016 年 12 月 14 日,雅虎宣布該公司有 10 億多用戶账號於 2013 年被黑客竊取。此次被盜的資料中可能包括姓名、聯系方式、密碼以及安全問答等內容,次年雅虎表示:所有 30 億雅虎用戶的個人信息被泄露,這一數字是 2016 年公布的 3 倍。

自《數據安全法》《個人信息保護法》先後實施,我們對數據安全和個人信息保護提出了更嚴格的要求。可以說,有關於數據治理,Web2.0 並沒有提交一份令人滿意的答卷。

數據使用的難度

在大數據與物聯網時代,萬事萬物都可稱之爲行走的「數據」源,也正因如此,數據存儲的增長率也是驚人的:從 2010 年到 2020 年,全球創建、復制和消耗的數據/信息總量爲 64.2 ZB,這一數字還正在增長。

根據 Statista 的數據,到 2025 年將超過 180 ZB。基於如此驚人的數據量增長,未來數據清洗和查驗的難度可想而知。

這亦是Web2.0 數據孤島所造成的負面影響之一。每打开一個應用,用戶都要不厭其煩地完成一次注冊,並可能在不知情的情況下,向應用开放了獲許其他信息的權限。各個應用都掌握着自己的用戶數據庫,彼此獨立,互不打通。

重復採集數據不僅會消耗大量的時間、網絡帶寬和計算資源,碎片化的採集狀態,更限制了對數據的全面分析和挖掘,難以發現數據中的潛在價值和洞見。大量數據的唯一性和正確性等待處理,不同的數據源之間進行有效的比較和驗證。

數據使用方需要花費大量的時間和資源來完成,加之提供者可能無法或不愿意提供詳細的數據採集方法、處理流程或溯源信息,例如傳統的無法原路自證的抽獎與搖號機制,這給使用方驗證數據的真實性和可靠性增加難度。

顯然,數據流通限制下的查驗成爲使用者無法繞過的難題。

數據價值的匹配

Web2.0 使更多用戶能夠交互並參與 Web 內容的創建,但並不是所有的用戶獲得了與之相匹配的權益。用戶生成的內容不僅被用於提升用戶的粘性,還有可能會被平台所有或被用於商業目的。

不少平台可能會收集和分析用戶的數據,從中獲取商業價值,例如通過廣告定向或銷售數據給第三方。

(圖源:swyftx)

Twitter(現在名爲 X) 已經准備將數據 API 作爲服務,向用戶打包售賣,數以億計用戶的登錄信息與應用操作取向(包括屏幕截圖、使用音頻、廣告的敏感度),正在或即將被轉賣出去,在這個環節裏,用戶被當成了“數據勞工”,源源不斷地哺育那些隨意更改用戶協議的平台和企業,此時用戶就是產品本身。

我們再提升視野層次,針對數據的價值討論究其根本是一個復雜而多維的過程,是否具有實用性、稀缺性、正確性、重要性,是否涉及到社會與集體價值,是否還能給數據使用者帶來潛在商業機會等等,都可以納入到影響數據價值分配的因素。

不同行業、組織和個人可能對數據的價值有不同的認知和評估標准,因此即便是用戶提供數據後能夠獲得相對應的價值分配,其價值的評估難度也是極大的。

進一步而言,因爲數據在數字環境中可以輕松地復制和傳播,其他參與者也可以訪問相同的數據,一旦使用者接觸了數據的內容,該數據所具有的獨特價值將大打折扣。

對於數據提供者來說,他們可能會嘗試通過提供附加服務、分析洞察力或與其他數據集的組合來增加數據的價值,此時的數據價值分配就會繞過作爲元數據的提供者,導致數據價值的分配變得更加復雜。

不破不立,Web 3.0 重塑數據價值

數據治理:讓數據安全可控

Web3.0 項目逐漸發現了將後端和元數據與去中心化存儲連接的重要性,Web3.0 鏈上數據通常分布在多個節點上,而不是存儲在單個中心化服務器上。

即使某些節點受到攻擊或故障,其他節點仍然可以繼續提供數據。特別是涉及用戶個人信息、財務數據和敏感業務數據,通過使用去中心化存儲,可以避免單點故障和中心化存儲的潛在安全風險,避免用戶數據的遭到損害。

在數據存儲與流通期間出現的安全問題,我們還可以使用新興的AI 技術進行及時排查。

AI 驅動的入侵檢測系統,經過建立行爲模型和規則引擎,自動進行漏洞掃描,對线上數據異常行爲進行實時監控和預警,例如使用暴力登錄嘗試和其他惡意活動。並且 AI 通過不斷機器學習,提高對網絡威脅的防御能力,分析攻擊模式、新型威脅和漏洞信息,憑借持續地自我學習並更新防御策略,及時適應變化的威脅環境。

(圖源:swyftx)

數據應用:讓數據可用不可見

在充分保護隱私的基礎上深度挖掘數據,是發展數字經濟的題中應有之義, 2022 年底發布的《中共中央國務院關於構建數據基礎制度更好發揮數據要素作用的意見》,數據「可用不可見」成爲法定要求。

運用隱私計算技術破解數據流通中的安全問題成爲必要技術與解決思路

隱私計算技術允許在不暴露原始數據的情況下進行計算和分析,進而保護敏感數據的隱私性。歐盟網絡安全局(ENISA) 將“隱私增強技術”定義爲旨在支持數據最小化、匿名化和假名化以及其他核心隱私和數據保護原則的技術。

以其中一條技術主线零知識證明(ZKP)爲例,證明者可以向驗證者展示自己擁有某個信息,而不會泄露該信息的實際內容。在證明過程中根據需要,可以將數據的訪問和使用權限進行精確控制,驗證者無法從零知識證明中獲取任何有關證明者所擁有的實際信息。

因此,數據主體可以通過零知識證明向應用證明其擁有某些特定的屬性或資格,而無需泄露個人隱私信息。應用可以驗證證明的有效性,而不需要了解具體的數據。

這種性質使得零知識證明成爲保護用戶隱私和進行身份驗證的強大工具,彌合用戶和應用之間的數據信任。同時隱私計算技術也爲實現安全的數據共享與合作,破除數據流通壁壘創造可能。

通過安全計算協議,不同組織可以在不共享原始數據的情況下進行分布式模型推斷或者訓練,保護數據提供方的知識產權的情況下,讓數據要素在信任基礎上充分流通,爲跨組織的數據合作和合規性提供了更多機會和靈活性,推動同業和異業公司在符合國家規範的條件下促成數據聯盟。

在實際業務場景中落地應用的隱私計算技術,面臨着迭代成本和穩定性等等的挑战,但隨着技術的不斷發展,數據市場的基礎設施將逐漸完善與成熟,解決的數據壟斷、隱私安全等問題指日可待。

數據價值:讓用戶共創共享

Web3.0 的核心概念之一是數據的所有權和價值歸屬的變革。

所有的累積的鏈上交互行爲數據,用戶都能夠公平地享有在此基礎上創造的價值,數據從一種資源,演變爲一種確權的、流動的、帶來收益的個人資產,這種激勵模式旨在實現讓所有個體的創造力被激發、被獎勵,這在 Web1.0 和Web2.0 階段是絕對無法想象的。

讓數據價值真正得以流動,首先基於每一條鏈上數據的產權都能夠予以確認。區塊鏈上的數據交易和所有權轉移完全公开可見,並且可以跨平台流動,原數據生產者的權益能夠得到全方位的保護。

正因如此,生產者可以通過智能合約定義數據的使用和共享規則,根據數據的附加價值和使用場景來制定不同的許可協議,以確保對附加服務和數據集組合的使用能夠得到合理的收益。

其次,數據資產流轉順暢的前提,是完成數據要素市場的培育。爲此,上海數交所在數據要素流通制度和規範率先作出探索,如發布數商體系,全新構建涵蓋數據交易主體、數據合規咨詢、質量評估、資產評估、交付等多領域的“數商”新業態,解決數據定價難的問題,充分釋放數字紅利。

包括【網易星球五周年特別限定】數字資產在內的多個數字藏品系列在上海數據交易所完成登記備案,並在“中國數字資產網”進行數字資產相關內容和權益的展現。

今年以來,上海數據交易所數據交易額不斷攀升,單月交易額已超1億元,預計2023年全年交易額突破10億元;數據產品掛牌數超1600個,涵蓋金融、航運交通、國際等板塊,日益活躍的市場交易生態正逐步形成。

Web3.0 還針對價值激勵部分提出全新的探索路徑:無論是生產者還是使用者,均可通過 DAO 參與決策和治理數據的使用和分配。

通過設定激勵機制來獎勵數據參與者的貢獻。例如,通過貢獻度算法或其他機制,對數據參與者在數據貢獻、數據質量、數據驗證等方面的貢獻進行評估和獎勵。這樣可以激勵數據參與者參與數據循環治理,同時確保他們能夠獲得公平回報。

在逐步解決權益保護、合規性和可持續性的問題,我們期待通過全新的生態架構 DAO,爲數據價值分配提供更廣泛的參考和共識。

 小結

Web 3.0 是一場不同技術路线融合的革命,在人工智能、區塊鏈技術等新興技術的結合重構的透明安全、價值共創的在线生態系統,在未來將催生令人興奮的新商業模式和治理場景。

在數據這一底層支柱上,我們期待更多普通用戶享受數據不僅作爲生產資料,更是作爲生產力,給予用戶帶來的體驗質變。

參考資料來源:

[1] 一文讀懂Web3數據賽道:市場結構、代表項目及未來趨勢;

[2] 深入探討隱私計算公鏈的可信化未來;

[3] 隱私計算白皮書(2022年);

[4] 萬字長文:Web3 數據市場展望;

[5] 基於公平理論的面向聯邦學習的公平獎勵分配方法;

[6]  “揭祕”上海數據交易所:做好數據要素流通“必答題”。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

標題:請回答 Web3.0 : 論「數據」打开的正確方式

地址:https://www.sgitmedia.com/article/15724.html

相關閱讀: