快訊 來源:科創(chuàng)板日報(bào) 2023-05-16 12:48:02
《科創(chuàng)板日報(bào)》5月16日訊繼表態(tài)“支持頭部企業(yè)打造對(duì)標(biāo)ChatGPT的大模型”后,北京市近日公開待定的新措施,直指AIGC發(fā)展中算力、數(shù)據(jù)不足兩大痛點(diǎn)。
據(jù)北京市政府網(wǎng)站消息,為搶抓大模型發(fā)展機(jī)遇,重視通用人工智能發(fā)展,北京市科委、中關(guān)村管委會(huì)制定了《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025年)(征求意見稿)》,公開征集意見時(shí)間為2023年5月12日至5月19日。
(資料圖片)
除了算力、數(shù)據(jù)要素,這些措施還涵蓋了AI發(fā)展的多個(gè)關(guān)鍵環(huán)節(jié),包括大模型技術(shù)、AI應(yīng)用、審慎監(jiān)管。
▌實(shí)施算力伙伴計(jì)劃 新增算力建設(shè)項(xiàng)目
針對(duì)算力不足的問題,北京市提出了三項(xiàng)待定舉措:發(fā)展商業(yè)算力、新增算力基建、建設(shè)多云算力調(diào)度平臺(tái)。
具體為組織商業(yè)算力定向滿足本市緊迫需求,加強(qiáng)與頭部公有云廠商等市場主體合作,實(shí)施算力伙伴計(jì)劃,并將新增算力建設(shè)項(xiàng)目納入算力伙伴計(jì)劃,加快推動(dòng)海淀區(qū)“北京人工智能公共算力平臺(tái)”,朝陽區(qū)“北京數(shù)字經(jīng)濟(jì)算力中心”等項(xiàng)目建設(shè),建設(shè)統(tǒng)一的多云算力調(diào)度平臺(tái),實(shí)現(xiàn)異構(gòu)算力環(huán)境統(tǒng)一管理、統(tǒng)一運(yùn)營。
其建設(shè)算力基礎(chǔ)設(shè)施的目標(biāo)是支撐千億級(jí)參數(shù)量的大型語言模型、多模態(tài)大模型、大規(guī)模精細(xì)神經(jīng)網(wǎng)絡(luò)模擬仿真模型、腦啟發(fā)神經(jīng)網(wǎng)絡(luò)等研發(fā)。
建設(shè)多云算力調(diào)度平臺(tái)是為了方便企業(yè)在不同云環(huán)境上無縫、經(jīng)濟(jì)、高效地運(yùn)行各類AI計(jì)算任務(wù)。
值得注意的是,該措施提出要為此建設(shè)北京與河北、天津、山西、內(nèi)蒙古等省(市)算力集群的直連基礎(chǔ)光傳輸網(wǎng)絡(luò),進(jìn)一步提升平臺(tái)對(duì)四地算力資源感知能力,探索開展算力交易。
▌中文語料太少怎么辦?將建設(shè)合規(guī)語料庫
目前,國內(nèi)各公司發(fā)展大模型缺乏用于AI訓(xùn)練的大規(guī)模中文語料集,無論高質(zhì)量的還是低質(zhì)量的中文語料集都極端缺乏。
對(duì)此,北京市提出,針對(duì)目前大模型訓(xùn)練高質(zhì)量中文語料占比過少,不利于中文語境表達(dá)及產(chǎn)業(yè)應(yīng)用的問題,整合現(xiàn)有開源中文預(yù)訓(xùn)練數(shù)據(jù)集和高質(zhì)量互聯(lián)網(wǎng)中文數(shù)據(jù)并進(jìn)行合規(guī)清洗。同時(shí)持續(xù)擴(kuò)展高質(zhì)量多模態(tài)數(shù)據(jù)來源,建設(shè)合規(guī)安全的中文、圖文對(duì)、音頻、視頻等大模型預(yù)訓(xùn)練語料庫,通過北京國際大數(shù)據(jù)交易所社會(huì)數(shù)據(jù)專區(qū)進(jìn)行定向有條件開放。
解決了棘手的數(shù)據(jù)來源問題,數(shù)據(jù)的收集和處理同樣是個(gè)昂貴且緩慢的過程,北京市提出要打造“國家數(shù)據(jù)基礎(chǔ)制度先行先試示范區(qū)”,謀劃國家級(jí)數(shù)據(jù)訓(xùn)練基地、搭建數(shù)據(jù)集精細(xì)化標(biāo)注眾包服務(wù)平臺(tái),研發(fā)數(shù)據(jù)采集、清洗、標(biāo)注、脫敏、存儲(chǔ)等功能在內(nèi)的數(shù)據(jù)處理工具。
另外,對(duì)于數(shù)據(jù)應(yīng)用、數(shù)據(jù)監(jiān)管,北京市均有相關(guān)具體措施,包括加大對(duì)政務(wù)、醫(yī)療、科研、自動(dòng)駕駛等領(lǐng)域數(shù)據(jù)的挖掘利用;確保訓(xùn)練數(shù)據(jù)集的規(guī)范性、加強(qiáng)個(gè)人數(shù)據(jù)保護(hù)等。
▌“算力即權(quán)力” 數(shù)據(jù)將成“勝負(fù)手”
當(dāng)下,人工智能已成為新一輪科技熱潮的核心發(fā)力方向。
5月5日中央財(cái)經(jīng)委二十屆第一次會(huì)議和國常會(huì)相繼召開,會(huì)議強(qiáng)調(diào),要把握人工智能等新科技革命浪潮。國家發(fā)改委近日表示,要加快發(fā)展數(shù)字經(jīng)濟(jì),重視通用人工智能發(fā)展。
以ChatGPT為代表的AIGC工具開啟了以大為美的人工智能新時(shí)代,隨著人工智能生產(chǎn)力被充分激發(fā)、多模態(tài)的興起,以及各種開源、小模型頻頻亮相,巨大的算力消耗能力、海量的數(shù)據(jù)需求已然成為技術(shù)迭代路上的攔路石。
誰能最先突破瓶頸,誰就能成為這輪科技革命的佼佼者。
國盛證券表示,“算力即權(quán)力”,算力是人工智能從玩具向工具的使能者。未來的算力將會(huì)呈現(xiàn)出從云端到邊緣梯度分布的格局,云端算力負(fù)責(zé)復(fù)雜科學(xué)計(jì)算,大模型運(yùn)算推理等任務(wù),邊緣側(cè)則憑借隱私、時(shí)延與成本三大優(yōu)勢,成為小模型與AI應(yīng)用觸及萬千用戶與場景的通道。
該機(jī)構(gòu)分析師宋嘉吉稱,隨著邊緣算力需求持續(xù)增加,模組作為邊緣算力的最佳載體,將成為AI的毛細(xì)血管,邊緣IDC也將為城域級(jí)算力建設(shè)打開全新空間,他列出了下列關(guān)注方向:
1)光通信:新易盛、天孚通信、中際旭創(chuàng)、太辰光、德科立、華工科技;
2)云算力:光環(huán)新網(wǎng)、奧飛數(shù)據(jù)、數(shù)據(jù)港、潤澤科技;
3)邊緣算力:美格智能、廣和通、龍宇股份;
4)服務(wù)器&交換機(jī):中興通訊、紫光股份、銳捷網(wǎng)絡(luò);
5)核心網(wǎng):震有科技。
東吳證券則指出,對(duì)于我國而言,算法和算力都可以通過挖掘優(yōu)質(zhì)人才、引進(jìn)優(yōu)秀工程實(shí)踐,或者直接購買海外優(yōu)質(zhì)資產(chǎn)追趕。而培養(yǎng)中文環(huán)境的優(yōu)質(zhì)數(shù)據(jù)集、語料庫卻必須長期自我積累沉淀,未來數(shù)據(jù)將成為AI發(fā)展的勝負(fù)手,并有望為中國訓(xùn)練自己的大模型,走出差異化道路提供重要基礎(chǔ)。
該機(jī)構(gòu)分析師王紫敬看好以下三個(gè)環(huán)節(jié):
1)數(shù)據(jù)運(yùn)營:預(yù)計(jì)醫(yī)保數(shù)據(jù)將有望成為公共數(shù)據(jù)放開的第一站,重點(diǎn)推薦久遠(yuǎn)銀海,建議關(guān)注山大地緯、中科江南等;
2)數(shù)據(jù)基礎(chǔ)設(shè)施:有望成為最先放量兌現(xiàn)的環(huán)節(jié)。重點(diǎn)推薦深桑達(dá)A,易華錄,云賽智聯(lián),建議關(guān)注中國電信;
3)數(shù)據(jù)安全:看好具備央國企背景和數(shù)據(jù)安全業(yè)務(wù)積累的相關(guān)廠商。推薦啟明星辰、奇安信、安恒信息、電科網(wǎng)安等。
標(biāo)簽:
免責(zé)聲明:市場有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
上一篇:世界最資訊丨長三角一體化示范區(qū)供排水專項(xiàng)規(guī)劃發(fā)布 到2035年示范區(qū)萬元地區(qū)生產(chǎn)總值用水量控制在20立方米以下
下一篇:最后一頁