久草视频官网,亚洲一区在线幕精品一区,日韩福利一区,国产尤物福利视频一区二区

數(shù)據(jù)應(yīng)用開發(fā)
當(dāng)前位置:首頁> > 數(shù)據(jù)應(yīng)用開發(fā) 正文
國家數(shù)據(jù)局:支持企業(yè)面向人工智能應(yīng)用創(chuàng)新,開發(fā)高質(zhì)量數(shù)據(jù)集,大力發(fā)展“數(shù)據(jù)即服務(wù)”“知識即服務(wù)”“模型即服務(wù)”等新業(yè)態(tài)。
時間:2025-06-25 07:53:41
來源:

在當(dāng)今數(shù)字化時代,人工智能技術(shù)的迅猛發(fā)展正深刻改變著各個行業(yè)的格局。數(shù)據(jù)作為人工智能的核心要素,其重要性日益凸顯。國家發(fā)改委等六部門在2024年12月30日發(fā)布的《關(guān)于促進(jìn)數(shù)據(jù)產(chǎn)業(yè)高質(zhì)量發(fā)展的指導(dǎo)意見》,明確提出:“支持企業(yè)面向人工智能應(yīng)用創(chuàng)新,開發(fā)高質(zhì)量數(shù)據(jù)集,大力發(fā)展“數(shù)據(jù)即服務(wù)”“知識即服務(wù)”“模型即服務(wù)”等新業(yè)態(tài)。”這一政策導(dǎo)向?yàn)閿?shù)據(jù)產(chǎn)業(yè)的發(fā)展指明了方向,也為企業(yè)提供了新的發(fā)展機(jī)遇。

一、數(shù)據(jù)集定義與分類

數(shù)據(jù)集是由標(biāo)準(zhǔn)化數(shù)據(jù)元素組成的集合,通常以表格、數(shù)組或特定格式存儲,便于檢索和分析。其核心要素包括數(shù)據(jù)元素、變量與模式、元數(shù)據(jù)。從數(shù)據(jù)類型來看,可分為結(jié)構(gòu)化數(shù)據(jù)集、非結(jié)構(gòu)化數(shù)據(jù)集、跨模態(tài)數(shù)據(jù)集。結(jié)構(gòu)化數(shù)據(jù)集具有清晰的數(shù)據(jù)結(jié)構(gòu),便于計算機(jī)處理和分析;非結(jié)構(gòu)化數(shù)據(jù)集則包括文本、圖像、音頻、視頻等多種形式,蘊(yùn)含著豐富的信息;跨模態(tài)數(shù)據(jù)集則融合了多種類型的數(shù)據(jù),能夠提供更全面的視角。

數(shù)據(jù)集的應(yīng)用場景廣泛,涵蓋人工智能訓(xùn)練、行業(yè)分析、政策協(xié)同等多個領(lǐng)域。在人工智能訓(xùn)練中,高質(zhì)量的數(shù)據(jù)集是訓(xùn)練出高性能模型的關(guān)鍵;在行業(yè)分析中,數(shù)據(jù)集能夠?yàn)槠髽I(yè)提供有價值的市場洞察和決策支持;在政策協(xié)同方面,數(shù)據(jù)集有助于政府更好地了解行業(yè)動態(tài),制定更科學(xué)的政策。

根據(jù)不同的應(yīng)用場景和用戶需求,數(shù)據(jù)集可分為通識數(shù)據(jù)集、行業(yè)通識數(shù)據(jù)集和行業(yè)專識數(shù)據(jù)集。

通識數(shù)據(jù)集包含面向社會公眾、無需專業(yè)背景即可理解的通用知識,主要用于支撐通用模型落地應(yīng)用。例如,一些常見的自然語言處理數(shù)據(jù)集,包含了大量的文本數(shù)據(jù),可用于訓(xùn)練通用的語言模型。

行業(yè)通識數(shù)據(jù)集包含面向行業(yè)從業(yè)人員、需要一定專業(yè)背景才能理解的行業(yè)領(lǐng)域通用知識,主要用于支撐行業(yè)模型落地應(yīng)用。比如,在醫(yī)療領(lǐng)域,行業(yè)通識數(shù)據(jù)集可能包含大量的醫(yī)學(xué)文獻(xiàn)、病例數(shù)據(jù)等,用于訓(xùn)練醫(yī)療行業(yè)模型。

行業(yè)專識數(shù)據(jù)集包含面向特定業(yè)務(wù)場景相關(guān)人員、需要較深的專業(yè)背景才能理解的行業(yè)領(lǐng)域?qū)I(yè)知識,主要用于支撐業(yè)務(wù)場景模型落地應(yīng)用。例如,在金融風(fēng)控領(lǐng)域,行業(yè)專識數(shù)據(jù)集可能包含特定的風(fēng)險評估指標(biāo)、歷史風(fēng)險案例等,用于訓(xùn)練針對該業(yè)務(wù)場景的模型。

 

二、數(shù)據(jù)集建設(shè)與價值評價

 

高質(zhì)量數(shù)據(jù)集建設(shè)是數(shù)據(jù)產(chǎn)業(yè)發(fā)展的基礎(chǔ),強(qiáng)調(diào)完整性、準(zhǔn)確性、規(guī)范性、均衡性、及時性、一致性、相關(guān)性等較高標(biāo)準(zhǔn)。完整性要求數(shù)據(jù)集包含足夠多的數(shù)據(jù)樣本,能夠覆蓋各種可能的情況;準(zhǔn)確性確保數(shù)據(jù)的質(zhì)量可靠,沒有錯誤或噪聲;規(guī)范性要求數(shù)據(jù)的格式、結(jié)構(gòu)等符合統(tǒng)一的標(biāo)準(zhǔn),便于處理和分析;均衡性保證數(shù)據(jù)在不同類別或場景下的分布合理,避免出現(xiàn)偏差;及時性要求數(shù)據(jù)能夠及時更新,反映最新的情況;一致性確保數(shù)據(jù)在不同來源或不同時間點(diǎn)上保持一致;相關(guān)性要求數(shù)據(jù)與特定的應(yīng)用場景或問題密切相關(guān),能夠提供有價值的信息。

數(shù)據(jù)集價值評價是一個多維度的過程,包括數(shù)據(jù)采集、標(biāo)注清洗、整合發(fā)布、維護(hù)等環(huán)節(jié)。在數(shù)據(jù)采集階段,需要評估數(shù)據(jù)的來源、采集方法和采集效率;標(biāo)注清洗環(huán)節(jié)則關(guān)注標(biāo)注的準(zhǔn)確性和清洗的效果;整合發(fā)布要考慮數(shù)據(jù)的整合方式和發(fā)布的渠道;維護(hù)環(huán)節(jié)則涉及數(shù)據(jù)的更新、管理和安全保障。此外,數(shù)據(jù)即服務(wù)、分析能力、模型即服務(wù)、計算能力、知識即服務(wù)、學(xué)習(xí)能力等方面也是評價數(shù)據(jù)集價值的重要維度。數(shù)據(jù)即服務(wù)強(qiáng)調(diào)數(shù)據(jù)的采集、整合、發(fā)布、維護(hù)等環(huán)節(jié)的服務(wù)化,能夠?yàn)橛脩籼峁┍憬莸臄?shù)據(jù)訪問和使用方式;分析能力評估數(shù)據(jù)集支持?jǐn)?shù)據(jù)分析的能力,包括數(shù)據(jù)分析的準(zhǔn)確性、效率和可解釋性;模型即服務(wù)關(guān)注通過數(shù)據(jù)提供模型服務(wù)的能力,如支持人工智能訓(xùn)練等,評價模型的性能、可擴(kuò)展性和易用性;計算能力考察數(shù)據(jù)處理和計算的基礎(chǔ)設(shè)施,如計算資源的充足性、計算效率等;知識即服務(wù)強(qiáng)調(diào)通過數(shù)據(jù)提供知識服務(wù)的能力,評估知識提取的準(zhǔn)確性、知識的豐富性和實(shí)用性;學(xué)習(xí)能力則關(guān)注數(shù)據(jù)集支持模型持續(xù)學(xué)習(xí)和優(yōu)化的能力,評價學(xué)習(xí)算法的效果和效率。

三、高質(zhì)量數(shù)據(jù)集開發(fā)

國家政策積極推動高質(zhì)量數(shù)據(jù)集建設(shè)。2025年2月19日,國家數(shù)據(jù)局在北京召開高質(zhì)量數(shù)據(jù)集建設(shè)工作啟動會,旨在推動高質(zhì)量數(shù)據(jù)集建設(shè),高效賦能行業(yè)發(fā)展。這一舉措體現(xiàn)了國家對高質(zhì)量數(shù)據(jù)集建設(shè)的重視,為企業(yè)開發(fā)高質(zhì)量數(shù)據(jù)集提供了政策支持和指導(dǎo)。

中央企業(yè)在高質(zhì)量數(shù)據(jù)集開發(fā)方面取得了優(yōu)秀成果,首批有10余個行業(yè)的30項(xiàng)央企高質(zhì)量數(shù)據(jù)集建設(shè)成果。這些成果涵蓋了多個領(lǐng)域,為行業(yè)發(fā)展提供了有力的數(shù)據(jù)支持。例如,在能源領(lǐng)域,央企可能開發(fā)了關(guān)于能源生產(chǎn)、消費(fèi)、價格等方面的數(shù)據(jù)集,為能源行業(yè)的決策和規(guī)劃提供依據(jù);在交通領(lǐng)域,可能開發(fā)了交通流量、事故數(shù)據(jù)等數(shù)據(jù)集,用于優(yōu)化交通管理和提升交通效率。

四、數(shù)據(jù)即服務(wù)、知識即服務(wù)、模型即服務(wù)

數(shù)據(jù)即服務(wù)是高質(zhì)量數(shù)據(jù)集建設(shè)的一個重要方面,強(qiáng)調(diào)數(shù)據(jù)的采集、整合、發(fā)布、維護(hù)等環(huán)節(jié)的服務(wù)化。在數(shù)據(jù)即服務(wù)的模式下,企業(yè)可以將數(shù)據(jù)作為一種服務(wù)提供給用戶,用戶無需關(guān)心數(shù)據(jù)的存儲、處理等細(xì)節(jié),只需通過簡單的接口或平臺即可獲取所需的數(shù)據(jù)。例如,一些數(shù)據(jù)服務(wù)提供商提供了豐富的API接口,用戶可以通過調(diào)用這些接口獲取各種類型的數(shù)據(jù),如天氣數(shù)據(jù)、金融數(shù)據(jù)等。數(shù)據(jù)即服務(wù)不僅提高了數(shù)據(jù)的可訪問性和可用性,還降低了用戶使用數(shù)據(jù)的門檻和成本。

知識即服務(wù)作為高質(zhì)量數(shù)據(jù)集建設(shè)的一個評價維度,強(qiáng)調(diào)通過數(shù)據(jù)提供知識服務(wù)的能力。知識即服務(wù)是將數(shù)據(jù)中的信息進(jìn)行提煉、整合和加工,形成有價值的知識,并以服務(wù)的形式提供給用戶。例如,在醫(yī)療領(lǐng)域,通過對大量的醫(yī)學(xué)文獻(xiàn)、病例數(shù)據(jù)等進(jìn)行分析和挖掘,可以提取出疾病的診斷方法、治療方案等知識,為醫(yī)生提供決策支持。知識即服務(wù)能夠提升數(shù)據(jù)的附加值,幫助用戶更好地理解和應(yīng)用數(shù)據(jù)。

模型即服務(wù)同樣作為高質(zhì)量數(shù)據(jù)集建設(shè)的一個評價維度,提到通過數(shù)據(jù)提供模型服務(wù)的能力,如支持人工智能訓(xùn)練等。模型即服務(wù)是將訓(xùn)練好的模型以服務(wù)的形式提供給用戶,用戶無需自己訓(xùn)練模型,只需提供輸入數(shù)據(jù),即可獲得模型的輸出結(jié)果。例如,在圖像識別領(lǐng)域,一些企業(yè)提供了圖像識別模型的服務(wù),用戶可以將圖像上傳到平臺,平臺返回圖像中的物體識別結(jié)果。模型即服務(wù)能夠降低用戶使用人工智能技術(shù)的門檻,促進(jìn)人工智能技術(shù)的普及和應(yīng)用。

 

五、具體數(shù)據(jù)集示例

體外診斷產(chǎn)品招采動態(tài)數(shù)據(jù)集是一個典型的數(shù)據(jù)集示例。該數(shù)據(jù)集提供高頻次、多管線、高可靠的體外診斷產(chǎn)品采購商機(jī)動態(tài)信息。其基本信息包括產(chǎn)品名稱、面向?qū)ο蟆?shù)據(jù)來源、數(shù)據(jù)主題、產(chǎn)品類型、數(shù)據(jù)專區(qū)、更新頻率、存儲大小等。輸入輸出字段詳細(xì)列出了地區(qū)、醫(yī)院、品類、招采預(yù)期、采購規(guī)模、信息來源等輸入字段,以及統(tǒng)計例數(shù)、品類查詢、日程計劃、商機(jī)定價等輸出字段。這個數(shù)據(jù)集可以為體外診斷產(chǎn)品的生產(chǎn)企業(yè)、經(jīng)銷商等提供有價值的市場信息,幫助他們了解市場需求、制定營銷策略。

呼吸道診斷產(chǎn)品管線注冊研發(fā)數(shù)據(jù)集是另一個重要的數(shù)據(jù)集示例。該數(shù)據(jù)集依據(jù)呼吸道診斷產(chǎn)品從試制樣品到獲批等多個流程節(jié)點(diǎn)過程中需要的模板、規(guī)則、指標(biāo)等生成注冊過程小模型,用以人工智能場景訓(xùn)練和知識服務(wù)。其基本信息包括產(chǎn)品名稱、面向?qū)ο?、?shù)據(jù)來源、數(shù)據(jù)主題、產(chǎn)品類型、數(shù)據(jù)專區(qū)、更新頻率、存儲大小等。輸入輸出字段詳細(xì)列出了產(chǎn)品管線、樣品批次、抽樣編號、注冊申請、初審材料、現(xiàn)場核查、現(xiàn)場抽樣、樣品復(fù)檢、資料評審、批準(zhǔn)注冊等輸入字段,以及流程總覽、節(jié)點(diǎn)值、規(guī)則值、模板樣例等輸出字段。這個數(shù)據(jù)集可以為呼吸道診斷產(chǎn)品的研發(fā)企業(yè)提供注冊流程的指導(dǎo)和支持,提高注冊效率和質(zhì)量。

來源:數(shù)據(jù)資產(chǎn)最前線公眾號

?
Copyright ? All 三明市數(shù)據(jù)集團(tuán)有限公司 Rights Reserved. 閩ICP備2020021516號 閩公網(wǎng)安備 35040202000255號 技術(shù)支持:云創(chuàng)集成
句容市| 东光县| 麦盖提县| 义马市| 宝清县| 胶州市| 德令哈市| 苍溪县| 南靖县| 南部县| 北京市| 顺义区| 东光县| 手机| 武川县| 乌兰浩特市| 柳林县| 海安县| 陈巴尔虎旗| 潜山县| 绥棱县| 高台县| 上饶市| 大安市| 稻城县| 赤壁市| 泰宁县| 托克逊县| 绥宁县| 林口县| 余江县| 汉沽区| 安阳市| 海口市| 肃宁县| 汪清县| 息烽县| 广东省| 佛冈县| 巴中市| 陇川县|