<dd id="iigsa"><track id="iigsa"></track></dd><rp id="iigsa"></rp>

    1. <dd id="iigsa"><track id="iigsa"><dl id="iigsa"></dl></track></dd>
      1. <tbody id="iigsa"></tbody>
        全國一體化大數據中心引領下超大規模數據要素市場的體系架構與推進路徑
        ??時間:2021-07-15

        摘 要:黨中央、國務院高度重視數據要素市場的培育。隨著全國一體化大數據中心建設的推進,我國構建超大規模數據要素市場的先天優勢逐步具備。梳理了國內外數據要素市場發展現狀及我國數據要素市場發展存在的不充分不平衡等問題,分析了原始數據、脫敏數據、模型化數據、人工智能化數據等四種層次的數據要素形態特征,將全社會范圍內數據要素的流動路徑劃分為數據共享、數據開放、數據交易三類,構建了包括技術層、數據層、政策層等的數據要素體系架構,探討了全國一體化大數據中心具體支撐數據要素市場培育的四條技術路徑,最后從加快數據資源化、資 產化、資本化、全球化以及強化數據立法和監管等五個方面提出了配套政策建議。

        關鍵詞:數據要素;數據要素市場;大數據;一體化;大數據中心;數據交易

        DOI10.16582/j.cnki.dzzw.2021.06.003

         

        數據成為新生產要素,與勞動、資本、技術、土地一起構成新經濟范式,全球從工業經濟時代邁入數字經濟時代。重視和利用數據要素的價值,已經成為社會各界的廣泛共識和世界各國的重大戰略抉擇。數據要素市場是將尚未完全由市場配置的數據要素轉向由市場配置的動態過程,目的是形成以市場為根本調配機制,實現數據流動的價值或數據在流動中產生價值[1]。黨中央、國務院高度重視數據要素市場的培育。202012月,國家發展改革委、中央網信辦、工業和信息化部、國家能源局聯合發布《關于加快構建全國一體化大數據中心協同創新體系的指導意見》,指出以深化數據要素市場化配置改革為核心,加快構建全國一體化大數據中心協同創新體系。未來,從數據規模和量級看,一體化大數據中心所處理數據將是巨量的,其作為支撐數據流通與交易的基礎設施,對我國構建全球領先的超大規模數據市場將起到重要支撐與推動作用。

        一、國內外數據要素市場的發展現狀

        近年來,隨著全球各國鼓勵和推動數據要素市場建設,國內外均涌現出一批有一定影響力的數據交易市場。總體來看,國內外現有數據交易平臺以API接口、數據包、人工智能工具、數據定制等產品為主,交易的數據覆蓋脫敏數據、模型化數據和智能化數據。部分平臺還提供數據加工、數據應用、解決方案、數據質量評價、行業報告等產品和服務。

        (一) 總體發展情況

        國外數據交易平臺自2008年前后開始起步,發展至今,既有美國的BDEXIfochimpsMashapeRapidAPI等綜合性數據交易中心,也有很多專注細分領域的數據交易商,如位置數據領域的Factual,經濟金融領域的QuandlQlik Data market,工業數據領域的GE Predix、德國弗勞恩霍夫協會工業數據空間IDS項目,個人數據領域的DataCoupPersonal等。除專業數據交易平臺外,近年來,國外很多IT頭部企業依托自身龐大的云服務和數據資源體系,也在構建各自的數據交易平臺,以此作為打造數據要素流通生態的核心抓手。較為知名的如亞馬遜AWS Data Exchange、谷歌云、微軟Azure MarketplaceLinkedIn Fliptop平臺、Twitter Gnip平臺、富士通Data PlazaOracle Data Cloud等。目前,國外數據交易機構采取完全市場化模式,數據交易產品主要集中在消費者行為趨勢、位置動態、商業財務信息、人口健康信息、醫保理賠記錄等領域。

        國內方面,20158月,國務院印發《促進大數據發展行動綱要》,提出引導培育大數據交易市場。201612月,工業和信息化部印發的《大數據產業發展規劃(2016-2020)年》中強調,要鼓勵數據交易發展。在政策的積極指引下,國內大數據產業鏈雛形初步形成,交易需求大增,各類大數據交易中心如雨后春筍般在全國各地成立。國內大數據交易機構起步于2015年,據課題組調研,截至2019年底,已有近80家大數據交易平臺投入運營,較為知名的如貴陽大數據交易所、上海數據交易中心、華東江蘇大數據交易中心、中原大數據交易中心、優易數據網等。除上述專業數據交易平臺之外,與國外類似,國內IT頭部企業亦在構建各自的數據交易平臺,如:阿里云、騰訊云、百度云各自旗下的API市場,以及京東萬象、浪潮天元等[2]。課題組研究發現,國內所交易的數據產品以粗放式為主,相似度高,開發程度及附加值較低。數據主要來自少數主流數據供應商,如大型互聯網企業、運營商,以及各產業頭部企業等。

        (二) 數據要素市場不平衡不充分問題較為突出

        當前,我國數據要素市場發展不平衡不充分問題較為突出,主要表現在以下三個方面:

        第一,從總量上看,當前我國數據要素市場場內交易發育不充分、場外交易亂象頻發問題比較突出。據課題組調研,目前我國數據交易平臺普遍規模較小,超過50%的數據交易平臺年流量低于50筆,大量處于停運或半停運狀態,大量數據需求只能通過場外數據灰市甚至黑市完成交易。特別是大量互聯網企業廣泛收集個人身份信息,并進一步關聯歸集社交、生活、購物、出行等數據作為用戶精準畫像依據,這些數據一旦被泄露,就會成為暗網和數據黑市中的熱門交易產品。近年來,涉及千萬量級的用戶隱私數據泄露事件已經不下數十起,主要來自內鬼盜賣和黑客兩大渠道。

        第二,從結構上看,數據要素市場部門壁壘、區域壁壘和產業壁壘依然突出。在政府層面,政務數據開放的動力機制尚未很好建立。政府數據開放剛剛起步,全國開放數據集規模僅為美國的約11%,企業生產經營數據中來自政府的僅占7%。在區域層面,各地政府牽頭組建的數據交易中心同質化競爭嚴重,且往往受限于區域壁壘,服務半徑很小,如武漢一度同時存在華中、長江、東湖三個數據交易中心。由于缺乏統一的數據要素市場交易規則和有效定價機制,導致每個交易平臺都只是獨立的小市場,阻礙規模化發展,服務能力不足,嚴重缺乏公信力。在行業層面, 近年來互聯網公司陣營劃分界限逐步明晰,壟斷現象開始凸顯,形成阿里系”“騰訊系”“百度系等數據共享陣營,彼此之間數據壁壘森嚴,阿里數加、京東萬象、騰訊大數據、百度AI交易平臺等頭部企業交易生態體系彼此競爭激烈,阻礙了數據要素市場的一體化步伐。

        第三,從實際運行看,支撐數據要素流通的交易要件體系尚未有效建立。數據尚不具備作為一種生產要素所必須的商品化、資產化機制,無法界定權屬、無法有效定價、無法可信流通,企業獲取政府數據、政府獲取企業數據或企業之間交換數據,均存在巨大障礙。

        在確權層面,數據作為一種虛擬環境物品,其權利體系的構成與界定與傳統現實物品差異很大,數據權屬生成具有主體多元、過程多變的特點,且同時存在國家主權、產權和人格權三種確權視角[3-5],彼此之間難以通約,需要對傳統民事權利體系理論進行擴充和完善。目前,全球數據立法規制主要包括歐(隱私權導向)美(財產權導向)兩大體系,前者對數據過度保護,數據產業發展活力不夠;后者則片面強調市場規則,個人隱私難以保障。我國數據確權原則尚不清晰,導致政府和產業無所適從,缺位、越位、錯位現象時有發生。

        在定價層面,不同于大多數商品先了解后使用的模式,多數數據產品的了解過程與使用過程重疊,導致數據可用性無法事先確定[6],買賣雙方對于數據價值的評估存在雙向不確定性”[7],再加上數據具有高固定成本低邊際成本[8],產權不清[9],來源多樣、管理復雜和結構多變[10]等特征,使得數據要素定價難度遠大于其他產品。目前,大量零散的數據交易定價均為針對特定應用場景的非標準化定價,缺乏統一的數據定價規則。

        在流通層面,缺乏權威、統一的數據可信流通基礎環境,數據交易雙方信任機制難以有效建立。在交易事前階段,由于當前絕大多數交易均依靠點對點場外交易方式,缺乏針對交易對手方和數據產品的評估體系,數據質量難保障,臟數據、假數據隨處可見。在交易事后階段,對于交易雙方而言,數據買定離手,如果缺乏可信的交易第三方監管,一方將數據移交另一方后,彼此均很難控制對方的數據使用流向,因此建立信任關系十分困難。

        二、數據要素市場的要素特征與構成

        我國人口眾多,經濟主體數量龐大,數據應用領先全球,未來數據總規模及增速將為全球首屈一指,構建全球領先的超大規模數據市場先天優勢已經具備。黨的十九屆四中全會首次增列數據作為生產要素,有助于我國實現超大規模數據和超大規模市場的優勢雙重疊加,搶抓數字經濟全球競爭新賽道優先權[11]。作為生產要素,數據具有區別于土地、資本等傳統生產要素的特點。培育超大規模數據要素市場,有必要厘清要素對象的特征、流動規律,從而構建相對健全的體系架構。

        (一)數據要素的四層次形態

        數據是事實或觀察的結果,是對客觀事物的邏輯歸納。數據按照結構,可分為結構化數據、非結構化數據和半結構化數據;按照反映事物的本體,可劃分為自然人、法人、車輛、物品、地點、事件等。國家強調建立生產要素由市場評價貢獻、按貢獻決定報酬的機制,因此,在數據要素市場建設中,應當更注重數據所傳遞的價值和數據開發加工的層次。在傳統信息理論中,根據加工情況通常將信息分為零次信息、一次信息、二次信息、三次信息。在此理論上,郭春芳[12]按照加工處理深度不同,將大數據信息服務分為零次大數據信息服務、一次大數據信息服務、二次大數據信息服務、三次大數據信息服務。按照信息和數據開發層次分類的原則,在國家政策文件中也得到了呼應,《關于加快構建全國一體化大數據中心協同創新體系的指導意見》(以下簡稱《指導意見》)明確指出,要完善覆蓋原始數據、脫敏處理數據、模型化數據和人工智能化數據等不同數據開發層級的新型大數據綜合交易機制

        按照《指導意見》要求,參照信息理論對信息價值的分類,在未來數據要素市場建設中,按照流通、交易數據要素的價值深度,可明確為四種要素形態(參見表1):一是原始數據(0階數據),即通過物理傳感器、網絡爬蟲、問卷調查等途徑獲取的未經處理、加工、開發的原始信號數據,零次數據是對目標觀察、跟蹤和記錄的結果,例如氣象領域的高空衛星原始信號、網絡領域的網絡流量數據包等。二是脫敏數據(1階數據),即為便于數據流通,確保數據安全和隱私保護,需要將原始數據中敏感或涉及隱私的數據進行脫敏處理后形成的數據。前兩種要素形態都是數據本身。三是模型化數據(2階數據),如互聯網企業用于精準營銷的用戶畫像標簽,其本身也是一種數據,但需要在原始數據基礎上結合用戶需求進行模型化開發,要素形態是數據+服務。四是人工智能化數據(3階數據),即在前三層數據之上結合機器學習等技術形成的智能化能力,比如人臉識別、語言識別等,其主要依托海量數據實現,要素形態則是服務。

         

        此外,由于數據本身難以脫離其依托的軟硬件基礎環境獨立存在,在實際運行中,數據流通與硬件(算力)和軟件(算法)密不可分,特別是二階和三階的數據交易流通場景實際上是數據+算法+算力的綜合體流通。

        (三) 數據要素流動的三條基本路徑

        要素流動是經濟活動向一體化發展的體現[13]。經濟學中對于生產要素流動的研究起源自國際貿易中的絕對優勢和相對優勢理論,并逐步延伸到區域和產業間的要素流動問題[14]。卡斯特爾斯認為[15],信息和通信技術的高度發達將改變實體經濟的空間概念,世界經濟將由地點空間space of place)轉向流動空間space of flows),后者就是跨越廣大領域而建立起功能性鏈接。路紫[16]認為,信息通信能夠將遙遠地方的節點和城市中心聯系在一起,使得基于數據、信息和知識連接構成網絡城市。與傳統要素相比,數據要素流動具有明顯的跨時空性,空間距離的遠近不再是首要影響因素,有必要從數據本身的特性出發思考數據要素流動問題。潘泰利將數據要素的流動路徑劃分為數據共享、數據開放、數據交易三類[17]。基于此,結合我國國情,可以將全社會范圍內數據要素的流動路徑劃分為數據共享、數據開放、數據交易三類。

        一是數據共享,即政府內部各部門為開展業務需要而進行的數據資源共享。在我國,作為要素流動路徑,數據共享的提出要明顯早于數據開放和數據交易。2002年,中共中央辦公廳、國務院辦公廳發布《國家信息化領導小組關于我國電子政務建設指導意見》,明確提出加強政府間數據資源共享的任務。數據共享不直接產生數據的商業價值,但數據要素的流動有效支撐了政府有關部門全面掌握社會經濟運行現狀、規律、問題,支持政府更好發揮經濟調控、市場監管、社會管理、公共服務作用,社會效益明顯。

        二是數據開放,即政府數據面向全社會的開放。數據開放行動起源于歐美。但歐美國家目前采取不同開放政策,美國將政府數據看作公共物品,向社會免費開放,而歐洲則采取補償模式,政府在開放數據時可收取一定費用[18]。目前,我國總體沿用美國的免費數據開放模式,也有部分研究者探討了政府數據面向社會提供增值收費服務的可能模式[19]

        三是數據交易。相比前兩者,數據交易是影響數據要素參與分配的關鍵流動路徑。其具體場景應包括三個部分:其一是實現公共數據普惠化開放的基礎上,探索面向特定對象的增值化服務。20213月,《第十四個五年規劃和2035年遠景目標綱要》明確指出,要開展政府數據授權運營試點,鼓勵第三方深化對公共數據的挖掘利用;其二是政府采購社會化數據,彌補政府數據的不足;其三是市場化主體之間的數據交易。當前,國內外數據要素市場的建設基本以數據交易為核心。

        廣義而言,這三條數據流動路徑都會對經濟社會發展產生促進作用,因此都應當納入數據要素市場體系的范疇之中,目前中央相關文件也基本上秉持這一觀點。狹義而言,當前需要推動建設的數據要素市場,則是上述三條路徑中的第三條,即需要發生交易結算場景的專門性服務場所。

        (四) 數據要素市場的體系架構

        數據要素市場旨在實現數據要素的市場化配置。從這個市場構成看,首先核心是匯集海量數據要素,特別是政府數據、企業數據,形成要素生態。其次,搭建促進數據要素流動的硬件(算力)和軟件(算法)環境,結合當前數據要素市場存在的普遍問題,需在底層技術路徑上構建數據資源調度、數據可信流通、數據綜合治理、數據安全防護等技術體系,為數據要素市場的運轉提供基礎設施支撐。再次,數據要素市場化配置需要建立在明確的數據產權、交易機制、定價機制、分配機制、監管機制、法律范圍等保障制度基礎上。因此,在設計頂層政策框架時,要進一步完善數據公共屬性的權屬安排,建立經濟激勵驅動的財稅金融制度和立法監管體系。政策制度層、數據層和技術層都應當納入數據要素市場體系的范疇之中,構建完善的數據要素流通的交易要件(參見圖1)。

         

         

        三、依托全國一體化大數據中心,構建超大規模數據要素市場新基座

        202012月,《關于加快構建全國一體化大數據中心協同創新體系的指導意見》指出,全國一體化大數據中心的功能包括完善數據流通共性支撐平臺,優化數據要素流通環境,牽引帶動數據加工分析、流通交易、軟硬件研發制造等大數據產業生態集聚發展。可以說,全國一體化大數據中心是培育超大規模數據要素市場的技術層基座,作為新型基礎設施為數據要素市場培育提供強有力的技術支撐。

        按照規劃,目前全國一體化大數據中心由數網”“數紐”“數鏈”“數腦數盾構成,其中數網數紐主要是對各類數據中心和云計算資源進行統籌和調度,為數據要素的底層流動提供軟硬件保障;數鏈是推動數據流通融合的重要環節,其作用是在對數據資源進行組織加工的基礎上打造數字供應鏈體系以滿足跨主體數據流通和綜合治理需求,包括數據組織關聯、數據可信流通、數據質量評估等模塊;數腦主要是應用導向,為政府治理和產業發展提供決策支持;數盾則是為整個全國一體化大數據中心提供可信安全計算存儲環境,形成核心關鍵環節的自主可控能力。

        面對超大規模數據要素市場培育的實際需求,全國一體化大數據中心作為新基座,其五大模塊將分別為數據要素市場提供以下四方面支撐(參見圖2)。

         

         

        (一)優化數據要素算力資源調度

        算力是數據要素發揮價值的基礎和引擎。從區域分布看,當前我國算力資源分布總體呈現東部不足、西部過剩的不平衡局面。按照全國一體化大數據中心的建設要求,數網數紐的建設將推動國家算力資源空間布局優化配置,推進各區域數字基礎設施和應用空間布局優化,打通國內數據要素循環,促進自由流通、按需配置、有效共享數據要素市場的形成。

        從技術層面看,有以下兩個方面:一是推動樞紐節點間建設數據中心直連網絡,擴容通信帶寬,降低數據傳輸時延,支持引導東部地區非實時算力需求向西部轉移,構建超大規模數據要素市場的新型基礎設施支撐體系,幫助中西部地區依托數據中心就地發展偏勞動密集型的數據加工產業,將瓦特產業轉化為比特產業,形成以數據為紐帶的東中西協調發展新格局;二是建設算力資源統一監測調度平臺,對異構軟硬件資源進行逐一適配、統一整合,實現軟硬件基礎設施資源的統一管理、統一分配、統一部署、統一監控,為各地政府和社會企業提供按需獲取的云計算、跨域跨網信息共享交換、多級異構云平臺協同調度能力,實現數據要素的高效流轉和聯通共用。

        (二)創造數據要素可信流通環境

        相比于組織內部的數據流通,組織之間的壁壘是一塊沉睡數據的集聚地,尤其是政企間數據的共享流通還處于起步階段,距離全面激發數據潛在價值仍有一定差距。全國一體化大數據中心的建設,能夠解決如下兩個方面的問題:

        第一,建立適配不同保密要求場景的統一數據要素流通環境(參見圖3)。在低保密場景下,基于明文數據共享交換+數據沙箱技術,實現數據閱后即焚;在中保密場景下,構建以密文數據交換為主的多方安全計算環境,實現數據可用不可見;在高保密場景下,建立以聯邦學習為主的聯合建模環境,實現數據不出門

         

         

         

        第二,構建覆蓋事前事中事后各環節的信任配套設施。在事前階段,基于區塊鏈、算法黑箱審查、CA認證、時間戳、數字簽名等技術,構建覆蓋交易法人、交易對象、交易過程、交易合同的數據公證體系,解決數據交易權責法律邊界問題;在事中階段,建立基于區塊鏈的政企可信數據聯盟,構建數據授權存證、數據溯源和數據完整性檢測系統,打造安全可控、有活力的數據流通生態,實現數據要素按需取用、精準調度、規定用途用量;在事后階段,充分發揮社會信用體系在實現數據可信流通方面的關鍵作用,強化數據流通交易全流程的信用監管,培育多層次市場需求,形成立體化可信交易網絡,從而更好地激發數據要素市場活力。

        (三)構建數據要素綜合治理體系

        盡管我國各地數字政府和智慧城市建設已經初具規模,但距離實現大數據支撐、全景式呈現、扁平化指揮、科學化決策要求還有一定差距。長期以來,可以用于支持決策的信息未能及時收集、篩選、匯聚、整合、處理和加工,無數可用、用而不準、準而不深現象較為突出,用數據說話、用數據決策、用數據管理、用數據創新的治理機制尚未完全建立。面對這一問題,數腦建設將促進各級各類政府數據和社會數據實現統一規劃、統一管理,倒逼數據要素的標準化稽查、清洗、去重、校驗和修復,建立起數據要素質量綜合評估體系,進而實現數據要素的價值化、資產化。

        從數據治理和定價的角度看,在數據要素形態中,0階和1階數據可沿用傳統的信息產品定價模式,采用協議定價、按次定價等方式實現價格生成。2階和3階屬于數據服務定價,可采用收益定價模式,在清晰界定數據用途用量基礎上,按照不同數據提供方對總體模型改進的貢獻度,并結合數據質量和數據成本評估等形成價格信號,各類市場交易主體通過區塊鏈共識算法實現博弈定價。

        (四)搭建數據要素安全防護體系

        數據安全是人治機治協同的過程,人治依靠建立信息安全相關的規章制度和管理標準進行約束,機治則依靠技術手段實現訪問控制、權限管理等功能。在全國一體化大數據中心體系中,通過風險識別與防護技術、數據脫敏技術、數據安全合規性評估認證、數據加密保護機制等實現對數據要素的安全保障。例如,通過敏感數據抽取、規則匹配、數據轉換、任務調度、任務狀態監控等技術,加強數據流轉過程的數據脫敏、加密,實現全流程安全漏洞監控;再如對數據開展分類分級管理,面向多元化數據交易場景,按照數據價值、內容敏感度、影響和分發范圍對數據進行敏感級別劃分,構建數據權限管控體系。

        四、推進超大規模數據要素市場建設的配套政策建議

        數據要素市場的建立,是加速數據要素流通、合理化數據資源配置的先決條件。全國一體化大數據中心為超大規模數據要素市場構建提供了強有力的基礎設施支撐,同時一體化大數據中心協同創新體系的構建,也離不開完善的數據要素市場環境,兩者相輔相成。未來在推進全國一體化大數據中心建設過程中,還需要協同解決以下幾項配套政策,助力超大規模數據要素市場的加快培育。

        一是筑牢數據資源化平臺和機制支撐。依托全國一體化大數據中心體系建設,超前規劃建設數據要素新型基礎設施體系,在京津冀、粵港澳、長三角、成渝等基礎條件較好的地區建設一批區域大數據中心,策劃實施東數西算”“南數北算等跨區域數據資源調度體系,暢通數據可信流通通道。在機制層面,加快推動政企數據平臺對接,探索形成政企數據融合的標準規范和對接機制,加速全社會各類數據融合。

        二是完善數據資產化機制設計。加快國家-區域-三級數據資產交易市場體系建設,規范引導互聯網頭部企業數據交易生態,探索場外交易信息披露和場內交易標準規范相結合的引導機制,完善事前主體登記、數據確權,事中交易撮合、報價磋商,事后可信流通、爭議仲裁的數據資產交易要件體系。

        三是建立數據資本化財稅金融政策。超前研究建立全球領先的數據資本化財稅金融政策體系,探索 數據出讓金制度,推動地方政府從土地財政逐步轉向數據財政良性模式,探索企業共享公共數據的稅收抵扣政策,完善適應數據資本化的配套金融政策。

        四是加快推動數據全球化要素流通體系。積極探索數據特區模式,鼓勵深圳中國特色社會主義先行示范區、海南自貿區(港)、中新(重慶)戰略性互聯互通示范等特定區域制度創新,加快離岸數據中心和全球數據港建設,培育形成全球數據要素生態體系,有力支撐對外開放和跨國企業業務開展中的跨境數據需求。

        五是強化數據立法和監管配套機制設計。在頂層機制方面,依托促進大數據發展部際聯席會議等,建立強有力的數據要素統籌管理機制。在確權立法方面,探索與歐美不同的第三條道路,在承認保護隱私權和財產權基礎上,強化數據公共品屬性,確立個人、企業、政府三邊確權體系和技術框架。在監管創新方面,堅持放開事前審批與強化事中事后監管并重,實現正面引導清單、負面禁止清單和第三方機構認證評級相結合,強化多主體協同和線上線下聯動治理。在風險防范方面,完善數據市場風險預警和應急處置,探索面向頭部企業的數據安全備案機制,切實強化數據安全和數據隱私保護。
            (作者:國家信息中心 王璟璇、竇悅、黃倩倩等,刊載于《電子政務》2021年第6期)


        国产ay电影天堂