日前,2024中關村論壇系列活動――第二屆北京人工智能產業創新發展大會舉辦。會上,國家發展改革委黨組成員,國家數據局黨組書記、局長劉烈宏受邀發言,分享了他基于數據和算力等角度對人工智能高質量發展的一些思考,并表示下一步,國家數據局將把握數字化、網絡化、智能化發展的趨勢,大力推進數據資源的整合共享和開發利用。
讓數據成為人工智能發展的催化劑
劉烈宏指出,2023年,以ChatGPT為代表的生成式人工智能在語言對話領域率先取得巨大突破,并陸續在計算機、生物、化學等領域取得顯著進展。國內諸多企業相繼推出大模型及相關的產品,并在互聯網服務和行業數據化場景中加速落地,展現出巨大的應用前景。2024年2月,視頻生成大模型取得突破性進展,引起全球廣泛關注和討論。大模型技術具有規模擴展性強、多任務適應性、能力可塑性強的特點,并仍在快速迭代、持續研究,有望成為通用人工智能的可行路徑之一。
劉烈宏指出:“我們要充分發揮數據的基礎資源作用和創新引擎作用,構建滿足人工智能發展需要的數據開放、共享、流通、交易的模式,全面提高數據資源開發利用水平,讓數據‘供得出、流得動、用得好’,真正成為人工智能發展的催化劑,推動做強、做優、做大數字經濟。”
劉烈宏表示,將數據作為生產要素,是我國首次提出的重大理論創新,這也為我們搶抓人工智能戰略機遇奠定了堅實的基礎。大模型驅動的人工智能發展對于高質量數據供給提出了更高要求,數據要素的市場化配置和開發利用顯得尤為重要。我們要充分發揮數據的基礎資源作用和創新引擎作用。
劉烈宏首談人工智能高質量發展
大會現場,劉烈宏分享了他基于數據和算力等角度對人工智能高質量發展的一些思考。
高質量數據是人工智能發展的根基。
在他看來,高質量數據是人工智能發展的根基。人工智能技術的歷次突破都離不開高質量數據集的支撐。
回顧歷史,由七萬張手寫數字圖片組成的數據集,促進了圖像識別領域的發展,快速推動了數據自動分類和聚類技術的發展;由1400萬張各類互聯網圖片組成的數據集開啟了深度學習的時代,極大地提升了人工智能感知技術的能力;由自然語言、編程語言、網絡數據等組成的萬億級多模態高質量數據級開啟了大模型時代,人工智能開始具備一定的認知交付能力,使得機器認知,甚至通用智能成為可能。
劉烈宏指出,今天數據的“質”和“量”是推動大模型不斷進步的關鍵。例如,在前提條件不變的前提下,使用更高質量的數據集來做訓練,能使20億參數量級的模型超過100億參數量級的模型。
高性能算力是人工智能發展的基礎。
高性能算力是人工智能發展的基礎。劉烈宏認為,面對生成式人工智能服務和大模型的迅速興起帶來的旺盛的算力需求,需要從算力供給和算力網絡調度等方面來做好統籌協調。從算力供給來看,需要加大低成本、高質量、易使用的算力供給;從算力網絡的調度來看,需要做好人工智能、模型訓練推理、離線分析等高時延業務等資源匹配,切實提升計算資源的整體使用率。
2023年12月,國家數據局聯合有關部門共同印發了《深度實施東數西算工程加快構建全國一體化算力網的實施意見》,從“通用算力、智能算力、超級算力的一體化布局”“東中西部算力一體化協同”“算力數據算法一體化應用”“算力與綠色電力一體化融合”“算力發展與安全保障一體化推進”等五個統籌出發,推動建設聯網調度、普惠易用、綠色安全的全國一體化算力網。
行業應用是人工智能落地的關鍵。
劉烈宏指出,行業應用是人工智能落地的關鍵。“我國超大規模市場為人工智能行業應用提供了豐富的土壤,這是我國推動人工智能應用邁向更高水平的重要優勢。”劉烈宏說道。
例如在交通物流行業,人工智能技術應用可以助力企業提升運輸效率,降低全社會物流的成本;在文化旅游行業開發文化大模型,能夠貫通各類文化機構的數據中心,充分挖掘文化數據的價值;在科技創新領域以科學數據支撐大模型的開發,可以更深入地挖掘各類科學數據和科技的文獻。
國家數據局與16個部門共同印發《“數據要素×”三年行動計劃(2024―2026年)》,提升數據利用水平,推動人工智能行業應用落地,推動社會各界共同挖掘市場的需求。這為人工智能技術的行業應用奠定了基礎。
安全治理是人工智能發展的保障。
另外,劉烈宏還指出,安全治理是人工智能發展的保障。人工智能在對經濟社會發展帶來深遠影響的同時也蘊含著隱私保護、算法安全、設施安全和技術耐用等潛在的風險隱患。
目前,國內多家企業已經設立了數據倫理安全委員會,積極落實行業自律,并取得了初步的成效。“在此基礎上,我們還應該多維布局,匯聚政府、行業、企業等各主體,從科技倫理、立法、技術實踐等維度推動人工智能安全治理,堅持創新發展和安全治理統籌原則,持續優化完善人工治理安全風險的防范。”劉烈宏說道。
保障體系是人工智能發展的支撐。
最后,保障體系是人工智能發展的支撐。人工智能高質量發展離不開人才的建設、標準規范和國際合作等保障體系。其中復合型人才是發展的強效動力,需要以社會需求和產業發展為導向,培養兼具理論和實踐,掌握數據、算法、分布式計算等技能的跨專業人才隊伍。
“統一的標準規范體系是發展的重要基礎,需要構建關于人工智能數據、算力和算法的標準體系,有效提升高質量數據和高質量算力的供給。”劉烈宏表示,“開放的國際合作是發展的必經之路,需要積極開展人工智能國際合作,打造互聯互通、互利共贏的人工智能的命運共同體。”
劉烈宏表示,下一步,國家數據局將把握數字化、網絡化智能發展的趨勢,大力推進數據資源的整合共享和開發利用,讓數據賦能人工智能的發展,讓數據真正實現“供得出、流得動,用得好”。同時打造全國一體化的算力調度體系,加速算力的高質量發展。
三部門共同研究提升“東數西算”網絡傳輸效能
3月1日晚,國家數據局公號發文稱,國家數據局等三部門共同研究提升“東數西算”網絡傳輸效能。
文章說,近日,為深入貫徹黨中央、國務院決策部署,加快落實《深入實施“東數西算”工程 加快構建全國一體化算力網的實施意見》,國家數據局會同國家發展改革委、工業和信息化部圍繞充分發揮“東數西算”網絡傳輸效能,進一步提高企業網絡傳輸性價比,聽取國家樞紐節點企業、數據傳輸需求企業,以及電信運營商等方面的意見建議,研究建立專用于國家樞紐節點間的公共傳輸通道,有效提升“東數西算”網絡傳輸效能。
文章披露,下一步,國家發展改革委、國家數據局、工業和信息化部將引導中國電信、中國聯通、中國移動等企業加強創新探索,近期將在部分樞紐節點間試點開通“東數西算”的“公共傳輸通道”,探索采用多種服務方式,增強普惠易用水平,切實提升企業主體獲得感。
“東數西算”工程自啟動以來,國家政策支持力度不斷加強,《數字中國建設整體布局規劃》《算力基礎設施高質量發展行動計劃》等一系列重磅政策措施的發布,加強算力、數據、算法協同應用,算力得以更快地走進千行百業。
據中國信息通信研究院測算,算力每投入1元,將帶動3元至4元的GDP經濟增長。加快算力建設,將有效激發數據要素創新活力,加快數字產業化和產業數字化進程,催生新技術、新業態、新模式,實現對經濟發展效能的放大、疊加、倍增作用。
AI的“三駕馬車”:數據、算法、算力
人工智能是新一輪科技革命和產業變革的重要驅動力量,數據、算法和算力被公認為人工智能的三大核心要素。
數據是人工智能發展的基礎。人工智能領域作為一個數據密集的領域,離不開數據的支持,其發展以海量數據作為基礎,數據越多越優,場景特點越豐富,算法性能越高,模型也就更高效。
算法可比喻為人工智能發展的大腦。是通過一系列人工智能算法,比如機器學習從海量數據中獲得規律,并利用規律對位置數據某些特性進行預測與判斷,是處理數據信息的規則與方式。
算法是實現人工智能的根本途徑,是挖掘數據智能的有效方法。當前,以深度學習為代表的算法快速發展拉開了人工智能浪潮的序幕,在計算機視覺、智能語音、自然語言處理、生物特征識別等領域廣泛應用,相繼超過人類識別水平。
在數據、算力和算法的進步與驅動下,近年來人工智能商業成熟度不斷提升,行業進入加速發展階段。與此同時,人工智能與傳統產業的融合發展,彰顯出了巨大的市場潛力,吸引了包括國內外科技巨頭、解決方案及設備供應商、傳統行業龍頭企業以及人工智能企業等各類企業,積極參與到各個層面及細分領域的發展布局和市場競爭中。
根據畢馬威發布的《人工智能全域變革圖景展望:躍遷點來臨(2023)》顯示,從全球范圍來看,人工智能企業數量經歷了由爆發式增長轉入穩步增長的階段變化。從2017年開始,全球當年新增AI注冊企業數量逐年下降,已從2017年的3714家下降到2022年的1106家。
結合各國對比情況來看,截至2023年6月底,全球人工智能企業共計3.6萬家,中美英企業數量名列前茅。美國人工智能企業數量約1.3萬家,在全球占比達34%,中國占比16%,英國7%%,美中英三國的人工智能企業數量合計占全球的56%。從人工智能獨角獸企業情況來看,截至2023年6月底,全球人工智能領域獨角獸總數達291家,美國和中國企業數量獨占鰲頭并基本平分秋色,分別為131家和108家。
中國人工智能領域企業密集誕生在2015年至2018年之間,約三分之二的人工智能領域核心企業成立年限在5-10年,隨著有效投資增長乏力,人工智能領域新增注冊企業數量在2017年達到峰值528家后,逐年下降,到2022年新增注冊企業數減少至63家。
結合區域布局來看,中國人工智能企業主要集聚于北京、廣東、上海、浙江等地,形成京津冀、長三角、粵港澳三足鼎立的格局,其中北京市人工智能企業數量有1,600余家。從人工智能獨角獸企業來看,北京市有41家,位居全國首位。上海市和廣東省數量位列二、三,分別有24家和23家。
當前我國人工智能產業加速發展,從基礎支撐、核心技術到行業應用的產業鏈條基本形成,一批創新活躍、特色鮮明的創新企業加速成長,新模式、新業態不斷涌現,整體呈現蓬勃發展態勢。政策支持、投資引導和巨頭布局將推動中國AI 產業的結構調整,進一步擴大市場規模。根據國際數據公司IDC數據顯示,2020 年,中國人工智能產業規模達到 68.36 億美元,預計 2023 年將達174.68 億美元,年復合增長率達到 40.52%。