You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

大數據走向平民化(車品覺)

By on June 30, 2015

 本文作者車品覺,為阿里巴巴集團副總裁、數據委員會會長、中國計算數學學會理事,為《信報》撰寫專欄「全民大數據」

我曾經跟一位美國零售集團的高管交流,得知數年前當傳統零售業意識到電子商務所帶來的改變時,除了大量招聘數據科學家,第一件事就是去收集線上對手大量的即時商品數據。經歷了幾年後,如今美國的大型零售公司都已具備選擇商品、動態定價及多終端多渠道的管理能力。為了支持每一秒鐘與對手的競爭,可以想像收集更廣更即時數據之重要性,即使是一個簡單的天氣變化,都有可能令你當前商品的競爭力落後於對手。

兵法有云「知己知彼,百戰不殆」,對於企業應該如何使用數據,這一句話最為貼切。當很多公司來問我該怎麼使用數據時,我必然會告訴他,用數據了解自己(知己)是第一步。第二步就是用數據來了解競爭對手(知彼),並根據對手的動態變化作出攻守判斷。大數據的首要關鍵,就在於如何量化數據大小與決策好壞的關係。

你可能會問:這麼高難度的事情,小企業如何跟得上呢?好消息是,在這幾年間,美國的大數據生態已逐步走向平民化。

專業工作變人人可做

最近美國一家專注數據收集爬取的公司Import.io,就讓我眼前一亮。互聯網是世界上最大的開放數據來源,通過Import.io的工具,用戶可以瞬間將眾多不同網站轉化為數據表格或API(應用程式介面)。Import.io每天從互聯網上搜集千萬條紀錄,至今已從30萬個網站上收集了上千億條數據紀錄。Import.io在同類公司中技術領先,曾多次獲評選為最佳創業公司。目前該工具對個人用戶免費開放,對企業用戶則源源不斷地提供大規模、定制化及具質量保證的數據。

io 30june

讓我感到興奮的是,他們把採集半結構化數據這項本來只有技術工程師才能做的事,變成了人人都可使用的平民化服務。而健康的大數據生態,應該是可以讓數據從收集、加工到應用的各個環節變得愈來愈精細,整個數據處理的過程形成一個互惠互利的產業鏈,大家都在大數據的海洋中共同分工協作。

我們不得不讚嘆美國大數據產業鏈的發達,有人做數據的中間層,比如把天氣跟零售的數據關聯起來給需要的人使用;有人把機器學習的門檻降低,變成MLS(Machine Learning as a Service), 讓不懂數據的人也具備數據學習的能力;也有人把數據視覺化變成簡單易用的工具。Import.io這樣的公司就把數據收集變成如水電煤一樣每個人都能使用的服務。

雖然大數據從原始數據到加工到使用是很長的鏈條,但如果有好的數據生態和產業鏈,每個人專注其中的一個環節,各司其職,分工協作,就能把數據的價值發揮到最大。希望在不遠的將來,中國也能跟美國一樣,早日建立豐富完整的數據產業鏈。

更多車品覺文章:

支持EJ Tech如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們