國家首次系統(tǒng)謀劃 這一新興產業(yè)年均復合增長率將超20%
1月13日,國家發(fā)展改革委、國家數據局、財政部、人力資源社會保障部四部門聯合發(fā)布《關于促進數據標注產業(yè)高質量發(fā)展的實施意見》(以下簡稱《意見》)。
什么是“數據標注”?簡單理解,就是給文本、語音、圖片、視頻等等各種各樣的數據“打標簽”。本次印發(fā)的文件是國家層面首次對數據標注這一新興產業(yè)進行系統(tǒng)謀劃。
年均復合增長率將超20%
數據標注產業(yè)向知識密集型轉變
自動駕駛、低空經濟、智能制造、智慧醫(yī)療等領域都離不開數據標注。據測算,2023年我國數據標注產業(yè)規(guī)模達800億元左右。
本次發(fā)布的《意見》提出,到2027年,數據標注產業(yè)專業(yè)化、智能化及科技創(chuàng)新能力水平顯著提升,產業(yè)規(guī)模大幅躍升,年均復合增長率超過20%。培育壯大數據標注產業(yè),對于推動人工智能創(chuàng)新發(fā)展具有重要支撐作用。
清華大學計算社會科學與國家治理實驗室執(zhí)行主任 孟慶國:高質量數據短缺,是我們一些大模型發(fā)展過程中遇到的瓶頸,數據標注就是對數據進行篩選、清洗、分類、標記等各種加工處理,能產生高質量的數據集,讓機器讀得懂、學得快、訓得好?,F在的一個新趨勢是,數據標注自身的自動化、智能化程度也在明顯提高,與此同時,細分領域變多,也需要金融、交通、能源、醫(yī)療等一些背景的專業(yè)人才,數據標注正在逐步從傳統(tǒng)的勞動密集型向知識密集型產業(yè)轉變。
《意見》還提出,建設成效顯著、特色鮮明的數據標注基地,形成相對完善的數據標注產業(yè)生態(tài)。目前,我國已確定成都、沈陽、合肥、長沙等7個城市承擔數據標注基地建設任務。
突出需求牽引和創(chuàng)新驅動
釋放公共數據、企業(yè)數據標注需求
本次《意見》從13個具體方面對培育壯大數據標注產業(yè)進行全面謀劃,特別突出需求牽引和創(chuàng)新驅動,培育一批深耕行業(yè)的數據標注瞪羚企業(yè)、獨角獸企業(yè)。
在深化需求牽引方面,《意見》首次提出釋放公共數據標注需求,依法依規(guī)有序推動公共數據標注與開發(fā)利用,在現代農業(yè)、智能制造、信息服務等重點領域發(fā)掘公共數據標注需求。
清華大學計算社會科學與國家治理實驗室執(zhí)行主任 孟慶國:中央經濟工作會議提出開展“人工智能+”行動,各個地方也在加快部署政務大模型,大模型在交通、氣象、醫(yī)療等民生領域的應用會越來越多,基于公共數據的標注需求也會不斷上升。如何讓公共數據釋放價值,一個核心工作就是做好海量公共數據的標注。
在增強創(chuàng)新驅動方面,《意見》中提出,完善數據標注標準,支持軟硬一體、自主可控的數據標注領域技術和關鍵設備研發(fā)。
此外,在優(yōu)化支撐體系上,《意見》中提到,加大財稅金融支持力度,推動數據標注服務納入政府采購范疇。同時推動數據標注職業(yè)體系建設,加強產業(yè)人才支撐。(劉柏煊 黃瑋)
編輯:遲明緒