習近平總書記指出,數據作為新型生產要素,對傳統生產方式變革具有重大影響,要構建以數據為關鍵要素的數字經濟。2019年10月,黨的十九屆四中全會首次將數據納入生產要素范疇;2022年12月,黨中央、國務院印發《關于構建數據基礎制度更好發揮數據要素作用的意見》(下稱“數據二十條”),這是我國首部從生產要素高度系統部署數據要素價值釋放的國家級專項政策文件。
隨著“數據二十條”等一系列政策措施相繼出臺,數據要素市場培育進展加速,暢通數據資源大循環的方向愈加明確。尤其是在人工智能快速迭代、大模型與大數據相得益彰的發展態勢中,數據要素戰略地位進一步凸顯。各地方、各部門、各大企業紛紛加快數據要素領域布局,從體制機制、市場流通、產品研發、標準規范等多層次、多角度開展落地方案的深度探索,涌現出數據要素價值釋放新熱潮。
工業互聯網產業聯盟組織產業界系統梳理了相關內容,展開數據要素系列科普活動。
數據要素Q&A
—— 小盟科普 ——
問:數據要素時代,有哪些新的數據處理技術?
答:以云原生、軟硬協同以及湖倉一體等技術為代表的數據處理技術持續助力用戶降本增效。
云原生技術通過存儲計算分離架構,實現資源池化和極致彈性,具備高擴展性、高可用性、跨地域規模、低成本等優勢,可為用戶提供真正具備秒級智能彈性擴容能力、隨需而動。
軟硬協同技術為軟件技術帶來了新的機遇,一些企業陸續發布GPU數據庫、數據庫一體機等產品,以滿足業務規模不斷擴張的需求。硬件技術的發展一方面促進了數據處理技術性能提升,另一方面也推動了數據處理技術與其他新興技術的融合,使得技術體系的安全性和智能性得到提升。
在湖倉一體方面,數據倉庫(Data Warehouse)和數據湖(Data Lake)兩項技術在不斷演進過程中逐漸融合形成湖倉一體(Data Lakehouse)技術架構。湖倉一體集數據湖的靈活性、可擴展性優勢以及數據倉庫的數據結構和數據管理功能于一體,能夠降低數據冗余、減少存儲成本,提升數據處理時效性。當前,湖倉一體技術落地應用速度持續加快,應用領域主要集中在互聯網、電信運營商以及金融等國內數字化程度較高行業。
問:數據要素時代,有哪些新的技術能保障數據要素安全流通?
答:以人工智能、隱私計算、區塊鏈及圖技術等為代表的新興技術持續護航數據要素安全流通。
AI技術與數據處理技術相結合降低技術使用門檻,2023 年 AIGC 技術的跨越式突破發展,不僅使大語言模型進入公眾視野,更擴展了數據基礎設施與AI融合的發展空間。以數據庫為例,生成式AI在數據庫結構設計、架構設計、數據分析挖掘等方面可以不同程度簡化人員操作,提高開發、運維、分析的效率,降低用戶使用門檻,更好助力數據流通。
數據庫與隱私計算相結合落地的全密態數據庫能夠解決數據全生命周期的隱私保護問題,使得無論在何種系統環境下,數據在傳輸、運算以及存儲的各個環節始終都處于密文狀態。
數據庫與區塊鏈技術相結合形成的防篡改數據庫能夠很好地保障云上數據可信運維。防篡改數據庫可以內部構建可信索引結構,確保數據庫數據的整體完整性,與區塊鏈相結合形成的解決方案,能夠形成鏈上鏈下鏈路數據安全可信,解決多方業務間數據安全可信流通難題。
隱私計算與區塊鏈相結合實現數據密態流轉。在控制面以區塊鏈為核心構建數據流通管控層;在數據面以隱私計算為核心構建密態數聯網。數據流轉過程中以密態形式流通,保障其流轉計算、融合直到銷毀的全鏈路安全可控,同時將數據要素持有權和使用權分離,實現數據可用不可見、使用可控可計量、以及使用權跨域管控。
圖聯邦技術能夠打破數據孤島,圖聯邦技術是為了解決數據孤島、隱私保護和數據安全問題提出的概念,在保護用戶隱私和公司數據的前提下,更好地發揮數據價值。
問:數據要素時代,有哪些新的技術能支撐新興業務場景?
答:向量數據庫、圖分析技術、時空大數據平臺以及時空數據庫等技術有效支持新興業務場景下的數據要素價值釋放。
向量數據庫能夠支撐AI技術賦能數據要素價值釋放。一些非結構化數據需要通過機器學習算法從中提取出以向量為表示形式的“特征”,向量數據庫的興起便是為了解決對這些向量進行存儲與計算的問題。
圖分析技術助力洞察數據連接新價值。數據要素時代,數據規模將會不斷增大,數據量及數據自身豐富度不斷增加,圖分析技術能夠有效分析數據之間的關聯性以及處理數據之間的復雜關系。
時空大數據平臺或時空數據庫能夠實現海量時空數據管理、查詢、統計與分析。在現實世界中有超過80%的數據都和地理位置(空間)相關,而所有數據均含有時間屬性。因此,實際業務場景中許多數據需要通過時空大數據平臺或時空數據庫來處理。近年來,時空大數據平臺以及時空數據庫等技術的發展有效應對北斗時空大數據服務、數字李生、智慧城市等新興數據應用業務場景下對于時空數據處理的需求。