今天是2019年12月XX日,距離2020年還有X天。

年末盤點(diǎn)一下,你還記得自己立下的那些Flag嗎?

也許你早已不記得了。

也許你還記得,但眼看著Flag就要倒下了。

 

但有人把三年前吹的牛,變成了現(xiàn)實(shí)。

2017年,我國在《新一代人工智能發(fā)展規(guī)劃》里,立下了一個(gè)這樣的Flag:在2020年中國人工智能的技術(shù)與應(yīng)用水平發(fā)展至世界先進(jìn)水平。

中國到底有沒有實(shí)現(xiàn)這一目標(biāo)呢?請看一組數(shù)據(jù):

目前,中國人工智能人才總量居世界第二、中國人工智能企業(yè)數(shù)量為全球第二、中國是全球人工智能專利布局最多的國家、中國人工智能論文總量和高被引論文數(shù)量均為世界第一……

 

在中國人工智能高速發(fā)展的背后,是大量人才智慧的匯聚,也是海量優(yōu)質(zhì)數(shù)據(jù)的支撐。

 

你不知道的數(shù)據(jù)標(biāo)注

數(shù)據(jù)標(biāo)注是人工智能進(jìn)行模型訓(xùn)練必不可少的一環(huán),這是將最原始的數(shù)據(jù)變成算法可用數(shù)據(jù)的過程:原始數(shù)據(jù)一般通過數(shù)據(jù)采集獲得,數(shù)據(jù)標(biāo)注相當(dāng)于對原始數(shù)據(jù)進(jìn)行加工,然后輸送到人工智能算法和模型里進(jìn)行調(diào)用。

如果把機(jī)器比做一個(gè)小孩的話,那數(shù)據(jù)采集就類似于買菜,數(shù)據(jù)標(biāo)注則類似于把菜進(jìn)行加工。加工好的菜用來喂養(yǎng)小孩,最終變成助力小孩成長的養(yǎng)分。

 

眾所周知,一道完美的菜,不僅要色香味俱全,最好還能保證健康和營養(yǎng)均衡。這就要求“廚師”不僅要會做菜,而且還要對菜的質(zhì)量有較高的要求。

在數(shù)據(jù)標(biāo)注工作中,不少企業(yè)都會要求標(biāo)注質(zhì)量優(yōu)先。因?yàn)?/span>高質(zhì)量數(shù)據(jù)之于人工智能,無論是業(yè)務(wù)層面,還是升維到人工智能的整體發(fā)展進(jìn)程,重要性不言而喻。

目前,大部分算法在擁有足夠多的普通標(biāo)注數(shù)據(jù)的情況下很容易將準(zhǔn)確率提升到95%,但從95%再去提升到99%就需要大量高質(zhì)量的標(biāo)注數(shù)據(jù)。可以說,高質(zhì)量的數(shù)據(jù)是制約模型和算法突破瓶頸的關(guān)鍵指標(biāo)。

 

滿足了質(zhì)量需求,接下來就要滿足速度的要求。因?yàn)閷τ谝恍╋埩枯^大的孩子而言,喂食的速度太慢,可能滿足不了他的成長需求。

現(xiàn)階段數(shù)據(jù)標(biāo)注主要依靠人力來完成,百萬級的數(shù)據(jù)對于標(biāo)注員來說是一個(gè)不小的壓力。再加上人工智能企業(yè)的數(shù)據(jù)需求是多樣化的——任何場景下的任何事物都有可能成為標(biāo)注需求。

為了滿足企業(yè)需求,提升標(biāo)注速度,大部分的數(shù)據(jù)服務(wù)公司都會使用標(biāo)注工具來輔助工作——一個(gè)強(qiáng)大的標(biāo)注技術(shù)平臺將會保證標(biāo)注質(zhì)量的同時(shí),有效提升標(biāo)注效率。

 

數(shù)據(jù)標(biāo)注速度提升的直接結(jié)果是標(biāo)注成本自然降低。不過,在行業(yè)內(nèi)混亂的數(shù)據(jù)運(yùn)營模式下,數(shù)據(jù)安全是需求方最為關(guān)注的問題。

文思海輝在數(shù)據(jù)標(biāo)注領(lǐng)域,擁有一支專業(yè)的標(biāo)注團(tuán)隊(duì),助力了大量知名互聯(lián)網(wǎng)企業(yè)的人工智能產(chǎn)品落地,服務(wù)領(lǐng)域包括無人駕駛、智能機(jī)器人等,積累了豐富的項(xiàng)目實(shí)踐經(jīng)驗(yàn)。

在數(shù)據(jù)質(zhì)量層面,我們始終以高于客戶標(biāo)準(zhǔn)2%—5%的要求來規(guī)范自己;在標(biāo)注工具層面,我們有自己的標(biāo)注平臺,能滿足客戶對于點(diǎn)、面、不規(guī)則多形態(tài)的數(shù)據(jù)標(biāo)注需求,具備對任何數(shù)據(jù)進(jìn)行標(biāo)注的能力;在數(shù)據(jù)安全層面,我們采取ODC交付模式,以絕對的安全保障交付。

 

洞察君溫馨提示:不到最后一秒,F(xiàn)lag大旗不倒