一個數(shù)據(jù)產(chǎn)品的交易歷程(一線調(diào)查·擴內(nèi)需 暢循環(huán))
數(shù)據(jù),作為一種新型生產(chǎn)要素,已快速融入生產(chǎn)、分配、流通、消費等各個環(huán)節(jié)。
黨的二十大報告提出,構(gòu)建全國統(tǒng)一大市場,深化要素市場化改革,建設高標準市場體系。今年6月,習近平總書記在主持中央全面深化改革委員會第二十六次會議時強調(diào):“促進數(shù)據(jù)高效流通使用、賦能實體經(jīng)濟,統(tǒng)籌推進數(shù)據(jù)產(chǎn)權(quán)、流通交易、收益分配、安全治理,加快構(gòu)建數(shù)據(jù)基礎制度體系。”
數(shù)據(jù)交易是構(gòu)建數(shù)據(jù)要素市場的關鍵一環(huán)。今年2月至7月,通過北京國際大數(shù)據(jù)交易所(以下簡稱“北數(shù)所”),北京海天瑞聲科技股份有限公司和禾多科技(北京)有限公司完成了一筆人工智能算法訓練數(shù)據(jù)產(chǎn)品交易。一個數(shù)據(jù)產(chǎn)品從采集、處理到交易、應用的過程是怎樣的?如何探索建立合規(guī)高效的數(shù)據(jù)要素流通和交易制度?記者近日追蹤了這次數(shù)據(jù)產(chǎn)品交易的全程,一探究竟。
數(shù)據(jù)采集——
數(shù)據(jù)越真越全越精,越能提升人工智能“聰明”程度
打左轉(zhuǎn)向燈起步、遇到過路行人減速繞行……在北京市石景山區(qū)的首鋼園自動駕駛服務示范區(qū)內(nèi),一輛輛自動駕駛汽車可以精準識別路況,做到安全起步、行駛、落客。
“只要在手機應用程序上下單,車輛就自動開到眼前來;點擊小程序的‘開始行程’按鈕,車輛就啟動了。”北京市朝陽區(qū)居民王女士對自動駕駛技術既贊嘆不已,也十分好奇,“這左拐右拐、上坡下坡的,它是怎么判斷的呢?”
“自動駕駛的實現(xiàn),是基于人工智能技術、先進傳感器、高精地圖等進行的技術‘大綜合’。人工智能技術就相當于自動駕駛系統(tǒng)的‘大腦’?!焙L烊鹇暿且患胰斯ぶ悄軘?shù)據(jù)資源和服務提供商,公司副總經(jīng)理李科告訴記者,為了使這個“大腦”更“聰明”,就需要運用各類數(shù)據(jù)來訓練人工智能算法,“人工智能算法做出判斷大致要經(jīng)歷‘接收數(shù)據(jù)’‘總結(jié)規(guī)律’‘形成判斷’3個環(huán)節(jié),數(shù)據(jù)樣本類型越全、精度越高、針對性越強,算法就會越聰明,自動駕駛系統(tǒng)的智能化水平就會越高?!?/p>
這次數(shù)據(jù)產(chǎn)品交易中,自動駕駛解決方案提供商禾多科技公司需要自己采集真實場景的原始數(shù)據(jù),這些數(shù)據(jù)由海天瑞聲進行專業(yè)處理后,形成人工智能算法訓練數(shù)據(jù),用于自動駕駛系統(tǒng)研發(fā)。
如何保證數(shù)據(jù)“原材料”的高質(zhì)量?有效采集至關重要。
“數(shù)據(jù)采集要盡可能接近真實路況?!焙潭嗫萍几笨偛么髡鸾榻B,在近期的一次數(shù)據(jù)采集中,工程師駕車從北京市順義區(qū)出發(fā),途經(jīng)望京區(qū)域、機場高速和4個停車場,行駛路程100多公里,現(xiàn)場采集到了道路狀態(tài)、交通信號和標識、車輛和行人目標以及天氣環(huán)境等信息。
“多位專業(yè)工程師駕駛數(shù)據(jù)采集車,車上安裝了雷達、攝像頭和傳感器用以收集數(shù)據(jù)。采集到的數(shù)據(jù)經(jīng)過合規(guī)處理,會被記錄在車載硬盤內(nèi),之后通過網(wǎng)絡閉環(huán)上傳至數(shù)據(jù)處理系統(tǒng),為下一步的篩選、標注做好準備?!贝髡鹫f。
據(jù)介紹,海天瑞聲與禾多科技今年完成交易的數(shù)據(jù)產(chǎn)品,其中許多涉及停車場景?!盀槿斯ぶ悄芩惴ㄌ峁┑挠柧殧?shù)據(jù),針對性越強,越有助于提升其在特定方面的智能化水平?!贝髡鹫f,有時根據(jù)客戶的需求,為了提升場景的針對性,團隊還會專門設置一些具體的情境。
“例如,為了提升自動泊車系統(tǒng)對三輪車這類交通工具的感知能力,我們會故意在停車場內(nèi)布置一些三輪車,然后安排工程師駕車前去采集數(shù)據(jù),再將這些數(shù)據(jù)處理后用于人工智能算法迭代?!贝髡鹫f。
數(shù)據(jù)處理——
由專業(yè)團隊協(xié)作完成,創(chuàng)造規(guī)??捎^的就業(yè)崗位
采集原始數(shù)據(jù)只是第一步,接下來需要技術人員對數(shù)據(jù)進行處理,讓人工智能算法可以“讀懂”這些數(shù)據(jù)。
處理數(shù)據(jù)的辦法主要是進行數(shù)據(jù)標注。“雖然我們可以在原始視頻上看出哪里是車道線、哪里是停車位,但如果不加以標注,人工智能算法是無法讀懂這些數(shù)據(jù)的?!崩羁普f,數(shù)據(jù)標注的基本原理是將原始視頻數(shù)據(jù)分為若干幀,由技術人員運用公司自研的智能化數(shù)據(jù)處理平臺及相關標注工具在每一幀上標注出相應內(nèi)容,“例如,標出汽車的位置在哪里,某個交通標志是什么意思,等等?!?/p>
在海天瑞聲公司總部,計算機視覺業(yè)務部高級項目經(jīng)理秦子雄向記者現(xiàn)場演示了數(shù)據(jù)標注的步驟:
“我們使用這個矩形框?qū)⑦@輛汽車框起來,算法后期就會讀‘明白’?!?/p>
如何精確定位這輛汽車?
“那就要使用接地線這個輔助工具,先確定幾個汽車輪廓上的關鍵點,再畫出數(shù)條接地線垂直于地面,這樣就可以確定汽車輪廓投影在地面上的具體位置。”
…………
幾番操作下來,經(jīng)過各種線和框“勾勾畫畫”,一幀視頻圖像標注完成。
數(shù)據(jù)標注不是一項輕松的工作,需要專業(yè)的技術團隊協(xié)作完成?!盀榱隧樌瓿蛇@次與禾多科技的交易,我?guī)ьI100多人的數(shù)據(jù)標注服務團隊工作了近5個月,標注完成了十幾萬幀的原始視頻數(shù)據(jù)?!鼻刈有壅f,在這個過程中,需要通過培訓幫助團隊人員熟練掌握規(guī)范,還要依靠公司平臺管理團隊、追蹤工作進度、交付最終成果,“數(shù)據(jù)標注是一個既有技術含量,也需要較多人力投入的工作,下一步公司將繼續(xù)加大數(shù)據(jù)處理平臺的研發(fā)力度,提升數(shù)據(jù)標注的智能化水平?!?/p>
從宏觀層面上看,人工智能產(chǎn)業(yè)的快速發(fā)展催生了對數(shù)據(jù)標注服務的龐大需求?!?022人工智能基礎數(shù)據(jù)服務產(chǎn)業(yè)發(fā)展白皮書》顯示,2022年,我國人工智能基礎數(shù)據(jù)服務市場規(guī)模將達47.8億元,預計2025年這一數(shù)字將突破120億元。目前,許多數(shù)據(jù)服務企業(yè)在中西部地區(qū)建立了數(shù)據(jù)標注基地,為當?shù)貏?chuàng)造出可觀的高質(zhì)量就業(yè)崗位。
數(shù)據(jù)交易——
建立數(shù)據(jù)流通信任機制,實現(xiàn)數(shù)據(jù)“上市有審核、采買有資質(zhì)”
海天瑞聲與禾多科技能順利完成這次數(shù)據(jù)產(chǎn)品交易,離不開北數(shù)所的撮合與服務。
“在去年3月底北數(shù)所成立之初,我們就受邀加入了其牽頭成立的北京國際數(shù)據(jù)交易聯(lián)盟,并在去年9月至10月上線了幾款數(shù)據(jù)產(chǎn)品?!崩羁普f,數(shù)據(jù)交易所在國內(nèi)還屬于新生事物,海天瑞聲作為首批“嘗鮮”的企業(yè)之一,在與北數(shù)所的交流合作中,也在不斷更新對數(shù)據(jù)交易模式的認知。
“過去,我們尋找客戶主要靠廣告推廣、參與展會等方式,得一個客戶一個客戶地談,屬于‘點對點’的模式?!崩羁普f,近一年多來,隨著買家在北數(shù)所數(shù)據(jù)交易平臺上相繼出現(xiàn),企業(yè)有條件從“點對點”過渡到“點對面”模式,依靠交易平臺提供的撮合服務來獲取客戶。
北數(shù)所相關負責人郎佩佩介紹,這兩家企業(yè)都是北數(shù)所的合作伙伴。了解到海天瑞聲在數(shù)據(jù)領域的綜合實力后,禾多科技決定與其開展合作。相關數(shù)據(jù)處理產(chǎn)品于今年2月至7月分兩期交付完成,合同在北數(shù)所進行了備案。
除了撮合供需雙方外,北數(shù)所還要對數(shù)據(jù)交易主體、數(shù)據(jù)來源、交易產(chǎn)品、數(shù)據(jù)用途等進行合規(guī)審核。郎佩佩說:“北數(shù)所要研判這些人工智能訓練數(shù)據(jù)的來源是否合規(guī),數(shù)據(jù)產(chǎn)品交付后的用途是否正當?shù)?。?/p>
目前,北數(shù)所構(gòu)建了由數(shù)據(jù)提供方、購買方、中介服務方和交易場所組成的北京國際數(shù)據(jù)交易聯(lián)盟,合力打造數(shù)據(jù)要素市場體系。統(tǒng)計顯示,北京國際數(shù)據(jù)交易聯(lián)盟已吸納大型商業(yè)銀行、電信運營商、互聯(lián)網(wǎng)企業(yè)、跨國機構(gòu)等150多家機構(gòu)或企業(yè)?!爸挥袑崿F(xiàn)確權(quán)、流通和交易后,數(shù)據(jù)資源才會轉(zhuǎn)變成可以量化的數(shù)字資產(chǎn)?!北本┙鹂丶瘓F黨委書記、董事長、北數(shù)所董事長范文仲表示,數(shù)據(jù)交易所要做的不僅是撮合交易,更應該建立一套技術、規(guī)則、機制、流程健全的數(shù)據(jù)流通信任機制,實現(xiàn)“上市有審核、采買有資質(zhì)”的數(shù)據(jù)交易良性生態(tài)。
數(shù)據(jù)應用——
訓練人工智能算法,賦能實體經(jīng)濟、提升用戶體驗
在地下車庫,上海市長寧區(qū)居民沈先生體驗了一把愛車的“記憶泊車”功能。
“開啟‘記憶泊車’功能后,我駕車從地下車庫的入口出發(fā),先完整地進行了一遍泊車入庫。這時車輛的自動駕駛系統(tǒng)已經(jīng)‘記住’了泊車路線。待再次出發(fā)時,車輛便由系統(tǒng)自動操控,按照設定的路線從車庫入口駛?cè)胲囄?。”沈先生說。
“記憶泊車”“跨層泊車”等高階自動駕駛功能的實現(xiàn),是人工智能算法通過訓練不斷“進化”的結(jié)果?!敖?jīng)過幾個月的迭代升級,我們的人工智能算法在泊車等場景上的智能化水平有了較大提高?!贝髡鹫f,目前企業(yè)研發(fā)的自動泊車系統(tǒng)已經(jīng)在廣汽集團的量產(chǎn)車上得到應用,將為消費者帶來更好的出行體驗。
將采集到的原始數(shù)據(jù)進行篩選、標注,把處理完成的數(shù)據(jù)用于訓練人工智能算法,最終賦能實體經(jīng)濟、提升用戶體驗。業(yè)內(nèi)人士表示,數(shù)據(jù)流通的這一過程折射出近年來我國數(shù)字經(jīng)濟的蓬勃發(fā)展態(tài)勢,也將促進各行業(yè)更好地應用數(shù)據(jù)要素。
“當前,我國數(shù)字經(jīng)濟發(fā)展成效顯著,但適應數(shù)字經(jīng)濟發(fā)展的規(guī)則制度體系仍有待健全?!?浙江大學國際聯(lián)合商學院數(shù)字經(jīng)濟與金融創(chuàng)新研究中心聯(lián)席主任盤和林說,下一步,應加快出臺數(shù)據(jù)要素基礎制度及配套政策,推進公共數(shù)據(jù)、企業(yè)數(shù)據(jù)、個人數(shù)據(jù)分類分級確權(quán)授權(quán)使用,構(gòu)建數(shù)據(jù)產(chǎn)權(quán)、流通交易、收益分配、安全治理制度規(guī)則,統(tǒng)籌推進全國數(shù)據(jù)要素市場化配置改革。
培育數(shù)據(jù)要素市場逐步取得了成效?!坝辛诉@次成功交易,我們和海天瑞聲將繼續(xù)深化合作,未來雙方有望達成更大量級的合作?!贝髡鹫f。
《 人民日報 》( 2022年11月28日 18 版)
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關法律責任。