陳國(guó)青 清華大學(xué)經(jīng)濟(jì)管理學(xué)院EMC講席教授,學(xué)術(shù)委員會(huì)主任。2005年度受聘教育部長(zhǎng)江學(xué)者特聘教授,擔(dān)任教育部高等學(xué)校管理科學(xué)與工程類專業(yè)教學(xué)指導(dǎo)委員會(huì)主任委員,國(guó)家信息化專家咨詢委員會(huì)成員,國(guó)際模糊系統(tǒng)學(xué)會(huì)(IFSA)副主席,中國(guó)信息經(jīng)濟(jì)學(xué)會(huì)副理事長(zhǎng),中國(guó)系統(tǒng)工程學(xué)會(huì)副理事長(zhǎng)等職。同時(shí)擔(dān)任國(guó)家自然科學(xué)基金委大數(shù)據(jù)重大研究計(jì)劃指導(dǎo)專家組組長(zhǎng),主持國(guó)家自然科學(xué)基金委重大項(xiàng)目等多個(gè)國(guó)家級(jí)科研項(xiàng)目,以及多個(gè)國(guó)際合作、企業(yè)信息戰(zhàn)略和管理項(xiàng)目。主要研究與教學(xué)領(lǐng)域?yàn)樯虅?wù)智能與電子商務(wù)、IT戰(zhàn)略與管理、模糊邏輯與數(shù)據(jù)模型。曾獲國(guó)際模糊系統(tǒng)協(xié)會(huì)2009年度“IFSA Fellow”;復(fù)旦管理學(xué)獎(jiǎng)基金會(huì)2007年度“管理學(xué)杰出貢獻(xiàn)獎(jiǎng)”;1999年度國(guó)家杰出青年科學(xué)基金等榮譽(yù)。
7月9日,大學(xué)生們?cè)诎不栈茨鲜写髷?shù)據(jù)展示中心參觀。新華社發(fā)
參觀者在位于濟(jì)南市的山東省檔案館推出的山東省大數(shù)據(jù)科普主題展上體驗(yàn)基于5G網(wǎng)絡(luò)傳輸?shù)腣R全息眼鏡。新華社發(fā)
貴州銅仁市一家蔬菜公司的工作人員在管護(hù)蔬菜。通過(guò)大數(shù)據(jù)云平臺(tái),蔬菜公司可以根據(jù)訂單來(lái)決定種植品種和規(guī)模。新華社發(fā)
大數(shù)據(jù)時(shí)代的兩個(gè)階段
我們現(xiàn)在處在一個(gè)數(shù)據(jù)的海洋當(dāng)中。
2019年的春運(yùn)被媒體戲稱為“世界上最大的人口遷徙”,有30億人次流動(dòng)。2018年“雙十一”網(wǎng)購(gòu)達(dá)到了2135億元的銷售額度。現(xiàn)在,每天會(huì)產(chǎn)生450億的微信條目。用手機(jī)的網(wǎng)民已經(jīng)達(dá)到8.17億。總體來(lái)說(shuō),我們國(guó)家的GDP數(shù)字經(jīng)濟(jì)占比已經(jīng)達(dá)到了34.8%,超過(guò)了1/3,這方面實(shí)際能夠體現(xiàn)出,我們這個(gè)社會(huì)已經(jīng)開(kāi)始越來(lái)越數(shù)字化了。
說(shuō)起大數(shù)據(jù)、大數(shù)據(jù)時(shí)代,主要的時(shí)代背景是什么呢?我們現(xiàn)實(shí)世界有多大程度上可以被數(shù)據(jù)表示?用一個(gè)形象的話來(lái)講,我們的社會(huì)像素正在急劇提升。這個(gè)“像素”來(lái)自到處可見(jiàn)的感測(cè)設(shè)備——探頭、智能手機(jī)、可穿戴設(shè)備、車載設(shè)備,林林總總。這些使我們這個(gè)社會(huì)的數(shù)字化程度越來(lái)越高,數(shù)據(jù)的粒度因此也越來(lái)越細(xì)。也就是說(shuō),數(shù)字化生活的兩個(gè)要素之一:像素、數(shù)據(jù)的粒度已經(jīng)具備。像素夠高的時(shí)候我們要干什么?形象地說(shuō)就是“成像”,就像手機(jī)、相機(jī),像素越高成像的質(zhì)量可能越好,因此,成像是我們數(shù)字化生活中另外一個(gè)重要的要素,像素和成像對(duì)應(yīng)起來(lái),就把數(shù)據(jù)和算法聯(lián)系起來(lái)了。這就是我們所說(shuō)的大數(shù)據(jù)的時(shí)代背景。
我認(rèn)為,大數(shù)據(jù)時(shí)代可以分成兩個(gè)階段。
第一階段是數(shù)據(jù)商務(wù)階段。不斷地把現(xiàn)實(shí)生活中的要素,人財(cái)物,都進(jìn)一步數(shù)據(jù)化,同時(shí)根據(jù)這些數(shù)據(jù)化的人財(cái)物進(jìn)行算法的應(yīng)用。
第二階段是算法商務(wù)階段。當(dāng)像素足夠高的時(shí)候,重點(diǎn)就變成了成像了,也就是說(shuō),重點(diǎn)變成算法應(yīng)用。
數(shù)據(jù)商務(wù)階段和算法商務(wù)階段都圍繞著數(shù)據(jù)和算法進(jìn)行,但是重點(diǎn)有所不同。數(shù)據(jù)商務(wù)階段就像做菜一樣,數(shù)據(jù)化的過(guò)程就是不斷準(zhǔn)備材料的過(guò)程,不停地增加和豐富材料,然后根據(jù)已有的材料提供不同的菜品。但是在算法商務(wù)階段,材料已經(jīng)足夠豐富了,這個(gè)時(shí)候要比的就是手藝了,你是不是能夠做得更好、更多。這就是我們所說(shuō)的算法進(jìn)階及應(yīng)用創(chuàng)新,如“智能+”,我們可以用更加高尖的智能技術(shù),包括人工智能的很多技術(shù),在現(xiàn)有的大規(guī)模數(shù)據(jù)下進(jìn)行應(yīng)用。
大數(shù)據(jù)的數(shù)據(jù)特征
那么,什么是大數(shù)據(jù)?首先看它的數(shù)據(jù)特征,可以從4個(gè)維度來(lái)理解,即4V:volume(規(guī)模)、variety(多樣)、value(價(jià)值)、velocity(速度)。大家對(duì)這四個(gè)維度沒(méi)有什么大的爭(zhēng)議,但是對(duì)它們的含義的理解還是有相當(dāng)不同的認(rèn)識(shí)的。
第一是規(guī)模,我們稱之為超規(guī)模。大數(shù)據(jù)規(guī)模會(huì)很大,但是沒(méi)有絕對(duì)的量綱標(biāo)準(zhǔn),沒(méi)有說(shuō)一定要達(dá)到多少G多少P多少Z才是大數(shù)據(jù),這個(gè)不一定,因?yàn)榇髷?shù)據(jù)的大規(guī)模和問(wèn)題、領(lǐng)域有關(guān)。只要這個(gè)大的規(guī)模超出了這個(gè)領(lǐng)域和問(wèn)題的傳統(tǒng)邊界,那就是大規(guī)模里的超規(guī)模。
第二是多樣,即富媒體的意思。現(xiàn)在80%~90%的數(shù)據(jù)都是文本、語(yǔ)音、圖像、視頻,不再是特別傳統(tǒng)的二維的整齊的結(jié)構(gòu)化的數(shù)據(jù)了。
第三是價(jià)值。我們處在數(shù)據(jù)的海洋中,四周都是數(shù)據(jù),但是跟我個(gè)人有關(guān),跟我企業(yè)有關(guān)的那種有價(jià)值的信息相對(duì)少了,因?yàn)閿?shù)據(jù)量的分母太大了,即密度在降低,這個(gè)后面直接的隱喻就是要深度挖掘才能發(fā)現(xiàn)我們希望的價(jià)值。
第四是速度。數(shù)據(jù)就像開(kāi)著的水龍頭一樣,源源不斷地出來(lái),而不是我們上傳下載圖片要等很久。因此,大數(shù)據(jù)里的數(shù)據(jù)是一個(gè)流數(shù)據(jù)的概念。
大數(shù)據(jù)的問(wèn)題特征
那么,什么樣的問(wèn)題才是大數(shù)據(jù)問(wèn)題?這要看它的問(wèn)題特征。
第一個(gè)特征,是粒度縮放。粒度縮放是指我們碰到的這個(gè)問(wèn)題的要素一定是數(shù)據(jù)化的,即這個(gè)要素不管是宏觀的還是微觀的,一定能通過(guò)數(shù)據(jù)表示。同時(shí),可以像地圖一樣,可以在特別大的范圍和特別細(xì)的范圍之間縮放,能夠在宏觀、微觀之間進(jìn)行映射。
第二個(gè)特征,是大數(shù)據(jù)外部性導(dǎo)致的特征,稱之為跨界關(guān)聯(lián)??紤]問(wèn)題的時(shí)候要看視角,問(wèn)題邊界是在哪兒,如果考慮問(wèn)題的時(shí)候這個(gè)邊界到了傳統(tǒng)邊界之外,就是跨界了,而且你把這個(gè)外部的要素和內(nèi)部要素聯(lián)系起來(lái)了,所以你在關(guān)聯(lián)。
第三個(gè)特征,全局視圖。大數(shù)據(jù)實(shí)際是希望了解全貌的,它最后是要看畫像,因?yàn)榍懊嫖业拿恳粋€(gè)點(diǎn)、每一個(gè)環(huán)節(jié)的數(shù)據(jù)叫作粒度縮放,同時(shí)和我相關(guān)的要素我又關(guān)聯(lián)了,但是我最后要干什么,要了解全貌,要有個(gè)人畫像、企業(yè)畫像、政府畫像、社會(huì)畫像等,所以這個(gè)畫像本身又是全景式的,從范圍來(lái)講是全景式的,從內(nèi)涵來(lái)講,我們希望既關(guān)聯(lián)又因果。
這里,我舉一個(gè)共享單車的例子,方便大家審視大數(shù)據(jù)問(wèn)題的特點(diǎn)。有的人會(huì)認(rèn)為共享單車其實(shí)就是我們的代步工具,但是這是傳統(tǒng)的概念?,F(xiàn)在一般每輛共享單車都有自己的感應(yīng)器和定位裝置,也就是說(shuō)感測(cè)的數(shù)據(jù)粒度到了車和部件。這時(shí)候就不單是一個(gè)單車了,可能我走到什么地方,共享單車的App就告訴我附近有什么商圈、酒店、餐館,我在什么地方買東西可能還可以用移動(dòng)支付,當(dāng)視角從單車走到了其他行業(yè)、要素時(shí),就開(kāi)始跨界關(guān)聯(lián)了。可能在這個(gè)地區(qū)人特別多,共享單車不夠,可能在另外的地方單車冗余了。因此,共享單車的平臺(tái)應(yīng)該清楚什么地方需要車,什么地方不需要車,怎樣調(diào)動(dòng),這就是全局視圖。當(dāng)共享單車具備粒度縮放、跨界關(guān)聯(lián)和全局視圖時(shí),共享單車的運(yùn)營(yíng)、優(yōu)化,就是一個(gè)大數(shù)據(jù)問(wèn)題。
這些年來(lái),社會(huì)上比較流行一個(gè)論斷,說(shuō)“大數(shù)據(jù)只講關(guān)聯(lián)不講因果”。這個(gè)論斷雖然有一定道理,但是總體來(lái)講是誤導(dǎo)的。特別是在重要決策的時(shí)候,如果涉及的后果可能會(huì)有嚴(yán)重的人財(cái)物的損失,然后我告訴你“你就這么干吧,沒(méi)有為什么”,誰(shuí)敢作決策?所以,在大數(shù)據(jù)環(huán)境下作管理決策,既要看關(guān)聯(lián)也要看因果。另外,因果是認(rèn)識(shí)論的基本訴求,我們要知道原因。
大數(shù)據(jù)沖擊各行各業(yè)
我們作為個(gè)人不僅是數(shù)據(jù)的接收者,也是數(shù)據(jù)的生產(chǎn)者。一方面我們下載、閱讀、瀏覽,因此我們?cè)谙M(fèi)數(shù)據(jù);另一方面,我們又上傳、撰寫、參加各種活動(dòng),各種活動(dòng)就可以留下我們的很多痕跡,因此我們也在留痕,我們實(shí)際又在產(chǎn)生數(shù)據(jù)。在這樣一個(gè)既是消費(fèi)又是生產(chǎn)的環(huán)境中,我們從方方面面已經(jīng)和數(shù)據(jù)分不開(kāi)了。
- 粵“網(wǎng)約護(hù)士”需實(shí)名認(rèn)證 配備追蹤系
- 男子顱內(nèi)“炸彈爆炸” 醫(yī)生成“拆彈專
- 中風(fēng)后服硝酸甘油用處不大
- 破解“三點(diǎn)半難題” 家長(zhǎng)舒心孩子開(kāi)心
- 濟(jì)南力爭(zhēng)今年年底前淘汰3.4萬(wàn)輛老舊高
- 國(guó)際社會(huì)認(rèn)知轉(zhuǎn)變將加速“一帶一路”
- 拿“國(guó)學(xué)”當(dāng)面具 遮不住販賣教育焦慮
- 銀聯(lián)卡:全球發(fā)了近七十六億張
- 農(nóng)業(yè)農(nóng)村部通知規(guī)范稻漁綜合種養(yǎng)產(chǎn)業(yè)
- 一加7 Pro參數(shù)全曝光了 驍龍855/曲面全面
- 華為折疊屏手機(jī)再度開(kāi)賣:上線秒光 黃
- 地震捕捉網(wǎng) 橫跨川滇等地78萬(wàn)平方公里
- 社會(huì) 我國(guó)自貿(mào)試驗(yàn)區(qū)建設(shè)迎來(lái)新飛躍
- 被慈善裹挾的獨(dú)立王國(guó)
- 加強(qiáng)實(shí)體藥店法
- 傳統(tǒng)消費(fèi)“降溫”,如何深挖消費(fèi)潛力
- 殘運(yùn)會(huì)上奪獎(jiǎng)牌
- 科技澳大利亞溺水死亡數(shù)創(chuàng)新高 澳高中
- 明略科技HAO智能推動(dòng)AI場(chǎng)景化落地
- 高度干預(yù)經(jīng)濟(jì)發(fā)展
