作者:Yingwu Gao

Yingwu Gao
是產(chǎn)品工程和 AI 實(shí)踐副總裁,負(fù)責(zé)企業(yè)產(chǎn)品工程與創(chuàng)新,包括 AI、數(shù)據(jù)科學(xué)和云計(jì)算。她所帶領(lǐng)的團(tuán)隊(duì)在定義和打造全新市場(chǎng)相關(guān)產(chǎn)品和服務(wù)方面(例如企業(yè) AI、云 AI 解決方案和 Pact.AI 平臺(tái)創(chuàng)新)扮演著至關(guān)重要的角色。

 

AI 如何將數(shù)據(jù)轉(zhuǎn)化為資產(chǎn):價(jià)值實(shí)現(xiàn)之旅

對(duì)您的企業(yè)而言,最寶貴的資產(chǎn)是什么?根據(jù)公司性質(zhì)的不同,您的答案可能包括銷售(如銷售人員和支持軟件)、供應(yīng)鏈(如庫存、倉庫和運(yùn)輸)等。  

如今,越來越多的企業(yè)認(rèn)為數(shù)據(jù)本身就是一種資產(chǎn)。實(shí)際上,數(shù)據(jù)本身并不是資產(chǎn),但它可以成為資產(chǎn)。數(shù)據(jù)無疑會(huì)將您的所有資產(chǎn)結(jié)合在一起,并通過卓越的軟件為其提供支持。但是,隨著來自各種來源(如機(jī)器、人員和數(shù)字進(jìn)程)的數(shù)據(jù)以前所未有的速度爆炸式增長,激增的數(shù)據(jù)呈現(xiàn)出一種未知狀態(tài)——原封未動(dòng)、未經(jīng)處理,遠(yuǎn)未實(shí)現(xiàn)其作為資產(chǎn)的潛力。  

矛盾的是數(shù)據(jù)越來越普遍,但無處不在的數(shù)據(jù)并不等同于有用數(shù)據(jù)。要使海量數(shù)據(jù)本身成為資產(chǎn),并像所有其他資產(chǎn)一樣發(fā)揮業(yè)務(wù)價(jià)值,企業(yè)必須部署人工智能 (AI) 技術(shù)。 

價(jià)值實(shí)現(xiàn)之旅

最大限度地挖掘數(shù)據(jù)價(jià)值對(duì)企業(yè)而言至關(guān)重要。在瞬息萬變的市場(chǎng)中,組織需要不斷尋找促進(jìn)增長的驅(qū)動(dòng)力。他們處于持續(xù)的壓力之下,必須最大限度地改善運(yùn)營效果并提高生產(chǎn)效率,以期實(shí)現(xiàn)投資回報(bào)的最大化??梢哉f,他們害怕錯(cuò)失消費(fèi)者行為轉(zhuǎn)變或新興創(chuàng)新推動(dòng)技術(shù)所帶來的機(jī)會(huì)。為了抓住這些機(jī)會(huì),企業(yè)需要不斷分析大量數(shù)據(jù)的含義。能夠洞察數(shù)據(jù)者,便是未來的贏家。但這一切的前提是——將數(shù)據(jù)轉(zhuǎn)化為資產(chǎn)。 

這一過程談何容易?數(shù)據(jù)具有多種格式,包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。正是這種復(fù)雜的性質(zhì)為數(shù)據(jù)價(jià)值的實(shí)現(xiàn)帶來了挑戰(zhàn)。例如,您的數(shù)據(jù)可視化軟件可以從運(yùn)營數(shù)據(jù)中獲取見解,但前提是數(shù)據(jù)采用 CSV 文件等結(jié)構(gòu)化格式。然而,現(xiàn)代數(shù)據(jù)很少采用結(jié)構(gòu)化格式,因?yàn)闃?biāo)準(zhǔn)商業(yè)智能軟件無法按原樣使用它們。如今,物流公司會(huì)通過其車隊(duì)的智能傳感器收集各種數(shù)據(jù)(包括 GPS 定位、車輛狀況、圖像、環(huán)境聲音,以及來自其他系統(tǒng)的交通和天氣數(shù)據(jù)),并使用這些數(shù)據(jù)以不同方式運(yùn)營現(xiàn)有業(yè)務(wù),甚至拓展全新業(yè)務(wù)。 

在與數(shù)據(jù)科學(xué)家交談時(shí),他們向我講述了耗費(fèi)大量時(shí)間對(duì)數(shù)據(jù)進(jìn)行工程處理(清理、組織和轉(zhuǎn)換)以提高預(yù)測(cè)模型準(zhǔn)確性的艱難時(shí)光。由于他們經(jīng)常需要處理 PB 級(jí)的結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù),這一過程的難度進(jìn)一步加劇。這項(xiàng)任務(wù)對(duì)任何一個(gè)人或一組人來說都過于艱巨。將數(shù)據(jù)開發(fā)成真正的資產(chǎn)是一項(xiàng)任重而道遠(yuǎn)的任務(wù),就像黃金精煉過程一樣。AI 可以在這一旅程中大展身手,實(shí)現(xiàn)流程的自動(dòng)化和智能化,并從數(shù)據(jù)中獲取見解,從而實(shí)現(xiàn)業(yè)務(wù)成果。 

搭載 AI 技術(shù)的數(shù)據(jù)管道

在人們的印象中,AI 往往是指播放音樂的數(shù)字助理或?yàn)橄麓钨徺I提供建議的推薦引擎。機(jī)器學(xué)習(xí)可以在幫助公司管理數(shù)據(jù)管道方面發(fā)揮日益重要的作用。搭載 AI 技術(shù)的數(shù)據(jù)管道可以減輕數(shù)據(jù)科學(xué)家的壓力,代替他們對(duì)數(shù)據(jù)進(jìn)行工程處理,使他們能夠?qū)W⒂谧约旱谋韭毠ぷ?mdash;—對(duì)數(shù)據(jù)進(jìn)行復(fù)雜建模。

以下是價(jià)值實(shí)現(xiàn)之旅的模式:

數(shù)據(jù)提取:首先,從不同的來源獲取和導(dǎo)入數(shù)據(jù)(通常為原始數(shù)據(jù)),并實(shí)時(shí)進(jìn)行流式傳輸或分批提取。然后,使用 ML 嵌入式安全性和合規(guī)性方法,通過自動(dòng)或混合流程從機(jī)器、系統(tǒng)、環(huán)境、人員以及介質(zhì)等處收集和檢索所選數(shù)據(jù),并將其存儲(chǔ)在數(shù)據(jù)湖或數(shù)據(jù)倉庫等目標(biāo)位置。最后,按需捕獲正確的數(shù)據(jù),開始價(jià)值實(shí)現(xiàn)之旅。

數(shù)據(jù)準(zhǔn)備:要將數(shù)據(jù)集轉(zhuǎn)換為可用形式,數(shù)據(jù)預(yù)處理或“數(shù)據(jù)整理”至關(guān)重要。在開始處理和分析之前,需要對(duì)數(shù)據(jù)進(jìn)行清理和轉(zhuǎn)換,然后再進(jìn)行重新格式化、篩選、聚合、標(biāo)準(zhǔn)化和擴(kuò)充。這一過程可通過 ML AI 自動(dòng)實(shí)現(xiàn)并且必不可少,能夠?yàn)閿?shù)據(jù)提供上下文信息以獲得見解并消除由于數(shù)據(jù)質(zhì)量低下而導(dǎo)致的偏差。在進(jìn)行特征工程之后,需要進(jìn)一步處理數(shù)據(jù),以便提取域相關(guān)字符,然后再針對(duì)數(shù)據(jù)進(jìn)行算法培訓(xùn)。

建模與評(píng)分:使用學(xué)習(xí)算法(ML DL)根據(jù)所準(zhǔn)備的數(shù)據(jù)對(duì)模型進(jìn)行培訓(xùn),該數(shù)據(jù)通常是要學(xué)習(xí)的培訓(xùn)數(shù)據(jù)集。學(xué)習(xí)算法會(huì)在培訓(xùn)數(shù)據(jù)中尋找數(shù)據(jù)模式,并輸出捕獲了這些模式的模型。培訓(xùn)完成后,將對(duì)生成的模型進(jìn)行評(píng)分、驗(yàn)證并測(cè)試其準(zhǔn)確性。隨后,根據(jù)評(píng)分結(jié)果調(diào)整超參數(shù),以獲得更全面、更準(zhǔn)確的結(jié)果。該模型可用于新數(shù)據(jù)集,以便從業(yè)務(wù)問題中獲取切實(shí)可行的見解,從而進(jìn)行預(yù)測(cè)、推薦和決策等。

數(shù)據(jù)提供:部署到生產(chǎn)環(huán)境中后,便可以提供和交付數(shù)據(jù)輸出和模型,然后用于加深數(shù)據(jù)理解、優(yōu)化業(yè)務(wù)運(yùn)營并提高管理能力。通過模型對(duì)未來結(jié)果進(jìn)行預(yù)測(cè)是數(shù)據(jù)價(jià)值實(shí)現(xiàn)的最佳示例。

該數(shù)據(jù)管道是一個(gè)正反饋環(huán)。隨著新數(shù)據(jù)的流入,搭載 AI 技術(shù)的數(shù)據(jù)管道將不斷提高饋送到 AI 模型中的數(shù)據(jù)質(zhì)量。當(dāng)然,這時(shí)必須謹(jǐn)慎處理。如果未能妥善處理來自結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)源的數(shù)據(jù)流,則有偏差甚至受污染的數(shù)據(jù)就會(huì)進(jìn)入 AI 模型,將您的潛在業(yè)務(wù)資產(chǎn)轉(zhuǎn)變?yōu)闃I(yè)務(wù)風(fēng)險(xiǎn)。

數(shù)據(jù)價(jià)值實(shí)現(xiàn)既是科學(xué)又是藝術(shù),必須不斷進(jìn)行投入和學(xué)習(xí),才能提取數(shù)據(jù)的真正價(jià)值并將其轉(zhuǎn)化為真知灼見。要使數(shù)據(jù)真正成為一種資產(chǎn),人工智能和人類創(chuàng)造力需要相輔相成,以便衡量所獲得的見解、發(fā)現(xiàn)數(shù)據(jù)模式并預(yù)測(cè)未知結(jié)果。憑借這種系統(tǒng)思維以及將 AI 應(yīng)用到整個(gè)數(shù)據(jù)流程的方法,您的數(shù)據(jù)流將發(fā)揮價(jià)值,數(shù)據(jù)湖將保持健康狀態(tài),使得數(shù)據(jù)生態(tài)系統(tǒng)實(shí)現(xiàn)可持續(xù)的蓬勃發(fā)展。這樣一來,數(shù)據(jù)可能會(huì)成為您最寶貴的資產(chǎn)。

Pact.AI

文思海輝的 Pact.AI 可提供完整的端到端產(chǎn)品組合,包括數(shù)據(jù)科學(xué)和數(shù)據(jù)工程服務(wù)、智能數(shù)據(jù)管道管理、預(yù)測(cè)和認(rèn)知分析、AI 應(yīng)用支持和解決方案加速器以及 AI 轉(zhuǎn)換,助您實(shí)現(xiàn)自己的 AI 產(chǎn)品愿景。使用 Pact.AI,您可以將數(shù)據(jù)轉(zhuǎn)化為最寶貴的資產(chǎn)。聯(lián)系我們,詳細(xì)了解 Pact.AI 如何助您將數(shù)據(jù)轉(zhuǎn)化為 AI 資產(chǎn)。