2018年,中國人工智能產(chǎn)業(yè)在政策支持、資本投入和技術(shù)突破的多重驅(qū)動(dòng)下,進(jìn)入了高速發(fā)展的關(guān)鍵階段。其中,人工智能公共數(shù)據(jù)平臺(tái)作為支撐技術(shù)研發(fā)和產(chǎn)業(yè)應(yīng)用的核心基礎(chǔ)設(shè)施,其建設(shè)與發(fā)展尤為引人注目。本報(bào)告將聚焦于2018年中國人工智能公共數(shù)據(jù)平臺(tái)的現(xiàn)狀、作用、面臨的挑戰(zhàn)及未來趨勢(shì)。
一、人工智能公共數(shù)據(jù)平臺(tái)的核心價(jià)值
人工智能的發(fā)展高度依賴于高質(zhì)量、大規(guī)模的數(shù)據(jù)。公共數(shù)據(jù)平臺(tái)通過整合來自政府、企業(yè)、科研機(jī)構(gòu)等多方數(shù)據(jù)資源,經(jīng)過脫敏、標(biāo)注、標(biāo)準(zhǔn)化處理,為AI算法訓(xùn)練和模型優(yōu)化提供了不可或缺的“燃料”。在2018年,這類平臺(tái)的價(jià)值進(jìn)一步凸顯:
- 降低研發(fā)門檻:為中小企業(yè)及初創(chuàng)團(tuán)隊(duì)提供原本難以獲取的數(shù)據(jù)資源,減少了數(shù)據(jù)采集與處理的成本與時(shí)間。
- 促進(jìn)協(xié)同創(chuàng)新:提供了一個(gè)開放、共享的環(huán)境,鼓勵(lì)學(xué)術(shù)界與產(chǎn)業(yè)界在統(tǒng)一的數(shù)據(jù)基準(zhǔn)上進(jìn)行技術(shù)競(jìng)賽與合作。
- 加速場(chǎng)景落地:針對(duì)智慧城市、醫(yī)療健康、自動(dòng)駕駛等垂直領(lǐng)域,提供特定場(chǎng)景的標(biāo)注數(shù)據(jù)集,直接推動(dòng)了AI解決方案的行業(yè)應(yīng)用。
二、2018年的發(fā)展態(tài)勢(shì)與主要玩家
2018年,中國在國家級(jí)和地方政府層面均加大了對(duì)AI公共數(shù)據(jù)平臺(tái)的支持力度。《新一代人工智能發(fā)展規(guī)劃》的落實(shí),催生了一批由政府主導(dǎo)或背書的公共數(shù)據(jù)開放平臺(tái)。領(lǐng)先的科技企業(yè)(如百度、阿里、騰訊、科大訊飛等)也基于自身生態(tài),構(gòu)建了面向開發(fā)者的AI開放平臺(tái),其中數(shù)據(jù)服務(wù)是重要組成部分。這些平臺(tái)通常提供包括圖像、語音、自然語言處理在內(nèi)的多種類型數(shù)據(jù)集,以及配套的計(jì)算資源和工具鏈,初步形成了“數(shù)據(jù)-算法-算力”一體化的服務(wù)模式。
三、面臨的突出挑戰(zhàn)
盡管發(fā)展迅速,但2018年AI公共數(shù)據(jù)平臺(tái)仍面臨諸多挑戰(zhàn):
- 數(shù)據(jù)質(zhì)量與標(biāo)準(zhǔn)不一:數(shù)據(jù)標(biāo)注的準(zhǔn)確性、一致性難以保證,不同平臺(tái)間的數(shù)據(jù)格式與質(zhì)量標(biāo)準(zhǔn)缺乏統(tǒng)一規(guī)范,影響了數(shù)據(jù)的互換與復(fù)用價(jià)值。
- 數(shù)據(jù)隱私與安全壁壘:如何在保障個(gè)人隱私、商業(yè)機(jī)密和國家安全的前提下合法合規(guī)地開放與共享數(shù)據(jù),是平臺(tái)運(yùn)營(yíng)面臨的最大法律與倫理考驗(yàn)。
- 數(shù)據(jù)流通機(jī)制不健全:數(shù)據(jù)所有權(quán)、使用權(quán)、收益權(quán)的界定模糊,導(dǎo)致數(shù)據(jù)供給方(尤其是政府部門和大型企業(yè))的開放動(dòng)力不足,數(shù)據(jù)“孤島”現(xiàn)象依然存在。
- 長(zhǎng)效運(yùn)營(yíng)模式待探索:平臺(tái)的持續(xù)更新、維護(hù)、技術(shù)支持和商業(yè)化運(yùn)營(yíng)需要穩(wěn)定的資金與人力投入,純粹的公益模式難以持久。
四、未來展望與建議
人工智能公共數(shù)據(jù)平臺(tái)的建設(shè)將走向更加規(guī)范化、專業(yè)化與場(chǎng)景化。建議:
- 強(qiáng)化頂層設(shè)計(jì)與標(biāo)準(zhǔn)制定:國家層面需加快出臺(tái)數(shù)據(jù)分類分級(jí)、安全開放、質(zhì)量評(píng)估等標(biāo)準(zhǔn)體系,引導(dǎo)平臺(tái)健康有序發(fā)展。
- 創(chuàng)新數(shù)據(jù)治理與流通技術(shù):積極探索基于聯(lián)邦學(xué)習(xí)、隱私計(jì)算等新技術(shù)的數(shù)據(jù)“可用不可見”流通模式,破解隱私與共享的矛盾。
- 深化“平臺(tái)+生態(tài)”建設(shè):鼓勵(lì)平臺(tái)運(yùn)營(yíng)方不僅提供原始數(shù)據(jù),更應(yīng)構(gòu)建包含工具、模型、算力及社區(qū)支持的全棧式生態(tài)系統(tǒng),提升平臺(tái)粘性與價(jià)值。
- 推動(dòng)重點(diǎn)領(lǐng)域場(chǎng)景化數(shù)據(jù)開放:優(yōu)先在與國計(jì)民生緊密相關(guān)的領(lǐng)域(如醫(yī)療、教育、交通)打造高質(zhì)量、高價(jià)值的專題數(shù)據(jù)庫,以應(yīng)用需求牽引平臺(tái)建設(shè)。
總而言之,2018年是中國人工智能公共數(shù)據(jù)平臺(tái)從概念走向大規(guī)模建設(shè)的元年。它既是AI產(chǎn)業(yè)發(fā)展的基石,也折射出數(shù)據(jù)時(shí)代治理與創(chuàng)新的復(fù)雜命題。只有妥善解決數(shù)據(jù)開放、共享與安全保護(hù)之間的平衡,才能充分釋放其潛能,為中國人工智能的長(zhǎng)期競(jìng)爭(zhēng)力奠定堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。