每日經濟新聞 2025-05-12 14:33:49
5月10日,在2025中國數谷·西湖論劍大會上,張向宏解讀了《數據基礎設施技術路線研究報告》。他表示,數據基礎設施的核心目標是解決數據“供不出、流不動、用不好”的問題,實現數據“供得出、流得動、用得好、保安全”。他提到,區塊鏈、隱私計算等六種技術路線兼具流通與安全特點,未來相關的技術路線將收斂成一條。
每經記者|張蕊 每經編輯|陳旭
張向宏,現任北京交通大學信息管理理論與技術國際研究中心特聘教授,為享受國務院特殊津貼專家。
他曾擔任中國軟件評測中心常務副主任、中國電子信息產業發展研究院副院長、中國信息安全研究院副院長等職,主持過50多項國家級重大課題研究和100多項地方和企業項目研究,曾參與起草十多部國家政策文件。
5月10日,以“數智無界 安全共生”為主題的2025中國數谷·西湖論劍大會在杭州舉行。大會期間舉辦了數據安全流通論壇,該論壇首次邀請18個數據基礎設施試點城市中超過半數的城市數據運營管理機構掌舵人齊聚一堂,共商數據基礎設施建設大事。
張向宏在論壇上對《數據基礎設施技術路線研究報告》作了解讀。論壇期間,他還接受了《每日經濟新聞》(以下簡稱NBD)記者的采訪。
NBD:在當前數字經濟快速發展的背景下,您認為我國數據基礎設施技術路線的核心目標是什么?為實現這一目標,需要在哪些關鍵技術領域取得突破??
張向宏:核心目標就是要解決一定程度上存在的數據“供不出、流不動、用不好”的問題。
我國數據基礎設施的定義是從數據要素價值釋放的角度出發,面向社會提供數據采集、匯聚、傳輸、加工、流通、利用、運營、安全服務的一類新型基礎設施,是集成硬件、軟件、模型算法、標準規范、機制設計等在內的有機整體。
這里面第一句話就是“從數據要素價值釋放的角度出發”,所以其根本任務就是讓原本不能流通的數據能夠流通起來,使流通慢的數據加速流通,并且在數據的供給、流通和使用過程中確保數據安全,即實現數據“供得出、流得動、用得好、保安全”。這就是根本目標。
衡量數據基礎設施是否卓有成效,主要有兩個指標:
一是是否有大量數據在應用、流通。如果只有三五個人或者三五十人的數據在流通,這也不能算,像滴滴、美團、攜程等平臺,上面有幾億用戶的海量數據在高速流通,這才是真正的數據基礎設施。
二是流通過程必須是安全的。
數據流通基礎設施要解決數據高效流通和可信安全的問題,其技術確實很難。計算機發展至今只有七八十年的歷史,安全和發展往往是割裂的。以前是由不同的人做,有的做發展,有的做安全,而現在需要將數據流通技術和保障數據安全技術結合起來,難度在這里。
所以,區塊鏈技術、隱私計算技術、數聯網技術,數據元件、數場、可信數據空間技術等這六種技術路線,目前來看都兼具了確保數據能流通并且流通過程安全的特點。而像傳統的TCP/IP協議(傳輸控制協議/網際協議)、云計算等,確實能讓數據流通,但是不保安全。
但前述六種技術目前還不夠成熟,例如區塊鏈和隱私計算技術雖然安全,但效率較低,難以大規模應用。隱私計算技術目前主要應用于銀行等金融機構,為高凈值客戶提供數據保護方案,成本較高,它只覆蓋少量用戶,因此不算基礎設施。
所以,要使隱私計算等技術得到更廣泛應用,必須突破如何在使用聯邦學習(一種分布式機器學習技術)、多方安全計算、密態等技術后,減少數據價值損耗、提高數據流通速率的問題。只有突破這一難題,隱私計算技術才能像5G一樣,降低成本,為更多行業和普通百姓服務。
因此當前如何在數據高速流通的過程中同時解決數據安全問題,這是相關技術的核心,也是難點。
張向宏教授接受采訪 每經記者 張蕊 攝
NBD:去年國家數據局發布了一個支持可信數據空間發展的文件,提出到2028年,我國將建成100個以上可信數據空間。您認為可信數據空間是一條比較有前景的技術路線嗎?
張向宏:這可以從兩個角度來理解。
一個角度是,《國家數據基礎設施建設指引》中提出了六條技術路線,可信數據空間是其中之一。從這個角度來看,可信數據空間與其他五條技術路線一樣,都是國家鼓勵試點試驗的技術路線。
目前,其他技術路線都沒有專項政策,而可信數據空間出臺了《可信數據空間發展行動計劃(2024—2028 年)》。從這個角度來看,在國家政策支持方面顯然與其他技術路線存在差異。目前,從社會反響來看,可信數據空間的探索確實相對比較多。
另一個角度是,未來的技術發展一定會收斂成“一個空間”,或者叫“一個場”“一個平臺”或“一個網”。無論叫什么名字,核心問題是數據在這個空間里是高效流通的,流通過程中是安全的。
構建這個空間、場或平臺時,可能會用到隱私計算技術、區塊鏈技術、數據控制技術、數據元件技術、數據沙箱技術等,這些技術不是必須用,但不用這些技術肯定無法實現目標。
至于稱呼,空間、場、平臺或網并無本質區別,關鍵在于要有大量數據的供數主體,帶來海量的數據資源;要有大量的用數主體,帶來豐富的數據應用場景;要有大量的數據服務主體,從數據資源到數據場景中間提供大量服務。
只要具備這些要素,無論叫什么名字都無所謂。把握數據基礎設施的核心要義,就是要將數據的供數主體、用數主體和服務主體放在一個空間上、一個場上、一個平臺上、一個網上。
NBD:不同行業的數據基礎設施建設需求應該是存在差異的,比如金融、醫療、交通等行業,您覺得在制定技術路線時,應如何平衡通用性與行業特殊性?
張向宏:在人類文明發展史上,生產要素可以劃分為三個階段:以土地和勞動力為要素的是農業社會,以技術和資本為要素的是工業社會,以數據為要素的是數字社會。
從20世紀90年代末開始,我們逐漸進入以數據為要素的數字社會,目前正處于加速階段,國民經濟和社會發展都在進行全面數字化轉型。
從這個角度來看,各行各業對數字化的需求并無差異。如果一個行業不進行數字化轉型,不通過數據發展業務、改善流程、降低成本,或者個人不通過數據平臺交友、購物、打車,生活將很難正常開展。因此,從需求角度來看,我認為各行各業的差異性并不大。
對各級政府來說,當前需要做的工作是填平“數據鴻溝”。國家數據局等部門出臺的《“數據要素×”三年行動計劃(2024—2026年)》列出的12個行業中,第一個是工業制造,第二個就是現代農業,這兩個是排在前面的,金融、醫療等排在后面。
目前我們還處于數據要素化發展的前期階段,過十年、二十年回頭再看,數據在傳統工業、農業等領域的應用將會非常廣泛。例如傳統物流業,以前數據應用較少,現在數據應用已經非常廣泛。
NBD:您認為生成式AI(人工智能)的訓練數據溯源難題、輸出結果不可控性是否將顛覆現有數據安全框架?您覺得監管應更側重訓練數據治理還是輸出內容管控?
張向宏:我個人認為,對于人類社會的技術進步,我們不應過度猜測,而應順其自然。過度憂慮只會增加人類的焦慮。
以人工智能為例,我們對人工智能當前這個發展階段的期望值過高。人工智能目前還處于發展階段,存在一些偏差是正常的,它目前的發展階段就是這樣,尚未達到真正的智能。
自動駕駛也是一樣,我們不能完全依賴自動駕駛技術,自動駕駛目前只是輔助駕駛,它出現一些偏差,你認為是它的問題,要限制它,這就是“人的焦慮”的反映。
今天我講到“數據基礎設施與人工智能需要高度契合”這個發展趨勢,舉例說DeepSeek解決了人工智能的算力瓶頸和算法瓶頸這兩大問題,我們叫算法平權、算力平權,這是一個重大突破。
人工智能有三大要素:算力、算法和數據。目前,算力和算法問題已經得到一定程度的解決,但數據問題仍然存在。我們應該關注如何構建更大規模、更高質量的數據集,使人工智能更聰明、更智能,這就是國家數據基礎設施要解決的問題。
我們要在國家數據基礎設施上讓數據“供得出、流得動、用得好”,集聚一大批各行各業的高質量數據集。數據應用于千行百業,其中有一個新興應用場景,就是人工智能,還有低空經濟等等,意義非常重大。
我們應該關注如何通過國家數據基礎設施建設解決“數據平權”問題,使人工智能得到突破性發展。由于數據來源不可靠等因素,人工智能會出現大模型幻覺等問題,如果能提供高質量的數據,這些問題就會減少。
封面圖片來源:每經記者張蕊攝
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP