證券日報新聞記者 周春媚
近期,有關大模型的相關政策與對策聚集頒布,喜訊不停傳出。7月13日,國信辦等七部門共同出臺了《生成式人工智能服務管理暫行辦法》,激勵生成式人工智能應用在各個行業、各個領域的融合創新;可就在信息公布前的一周,上海市人工智能實驗室宣布開源系統了“秀才·浦語”大模型70億主要參數輕量版本號InternLM-7B,適用免費商用,根據這一底座實體模型,各單位與科研機構能夠開發設計打造出分別垂直領域的大模型。
這種各項政策,展現了我國推動生成式人工智能技術持續發展和完善運用的心態,也幫領域大模型加快運用帶來了更多可預測性。訪談過程中,幾乎所有的采訪者都向記者表示,領域大模型浪潮下,數據信息直接關系到領域大模型的專業水平與精確度,必要性正持續突顯。
這種觀點幾乎成了一種“領域恰當”,可一個問題卻一直索繞新聞記者心中:都覺得數據信息、算率、算法是人工智能技術的三大基本因素,為什么算率跑道這般喧鬧,處理芯片、網絡服務器、光纖模塊等市場熱點五花八門,數據信息跑道則顯得有一些“難堪”和不冷不熱?
實際上,那也是業界很多者的同樣體會。總體來看,深層原因與數據產品的獨特性、現階段數據交易市場卻不完善等諸多有一定關系。
就數據產品本身而言,其“非標準化”和“無法通用性”的特點,取決于數據產品無法在銷售市場中形成統一和“公允價值”其價值。算率因素里的基本硬件配置通常是實價的“錢”,處理芯片、網絡服務器等費用都可以測算,可以在不同行業大模型產品研發中通用性,價值容易反映。但是數據價值需在特定場景下完成,數據庫的經營規模、品質也難以統一考量。很多碎碎的、非標、個性化的場景營銷,讓數據產品難以達到規模性運轉。
就數據交易市場來講,現階段我國在數據合規管理土地確權、計量檢定定價、融洽分派、安全隱私維護等方面基本性難點仍待破譯,特別是在數據確權層面,尚未形成確立規范和標準。針對領域大模型來講,數據信息具備公域特性,有一定的獲得堡壘,在安全與隱私性上面還有更高要求。一直以來,數據庫違反規定搜集、個人信息泄露等安全隱患是世界各國監管部門對生成式人工智能較大顧忌,也是影響大模型落地較大可變性因素之一。在基本性機制和標準暫未確立的情形下,數據交易和網絡服務也面臨著諸多限制以及阻礙。
但是,伴隨著大模型在各行各業的運用持續走深,業內對高品質數據的“難耐”將促進數據信息產業供應鏈長遠發展,有關方面已經積極行動起來。國家工信部電子器件第五研究所副所長王蘊輝詳細介紹,現階段所里早已協同產業鏈側建立了“大模型產業應用調研組”,從加快數據要素市場化、健全數據資源安全性社會治理體系等多個方面正確引導并規范市場發展趨勢。在實體模型商業化的業務需求刺激推動下,數據生態平臺建設有希望加速,數據要素市場也有望迎來長足的興盛。
大眾商報(大眾商業報告)所刊載信息,來源于網絡,并不代表本站觀點。本文所涉及的信息、數據和分析均來自公開渠道,如有任何不實之處、涉及版權問題,請聯系我們及時處理。大眾商報非新聞媒體,不提供任何互聯網新聞相關服務。本文僅供讀者參考,任何人不得將本文用于非法用途,由此產生的法律后果由使用者自負。
如因文章侵權、圖片版權和其它問題請郵件聯系,我們會及時處理:tousu_ts@sina.com。
舉報郵箱: Jubao@dzmg.cn 投稿郵箱:Tougao@dzmg.cn
未經授權禁止建立鏡像,違者將依去追究法律責任
大眾商報(大眾商業報告)并非新聞媒體,不提供任何新聞采編等相關服務
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP備2023001087號-2