Don't Miss

數據為王決定人工智能 (黃錦輝)

By 信報財經新聞 on August 20, 2019

本文作者黃錦輝為香港中文大學工程學院副院長（外務），為《信報》撰寫專欄「行業微觀」。

機器學習是體現AI的「關鍵促成技術」，可以基於不同方法落實，如神經網絡等。（Freepik網上圖片）

人工智能（AI）系統利用機器（軟件或硬件）代替人類的行為，要達到這目標，持續學習非常重要。人類自小便爭取機會多讀書、看報紙、看電視、上網等，目的就是增廣見聞，充實自己。同樣地，電腦也仿效人類不斷學習，此行為便是多年來科學家積極鑽研的「機器學習」（Machine Learning, ML）。機器學習是體現人工智能的「關鍵促成技術」（Key Enabling Technology），概括而言其落實可以基於不同方法，例如數學模型（Mathematical Modeling）、計算機算法（Computational Algorithm）、神經網絡（Neural Network）等。

「深度學習」技術應用廣泛

值得注意是近年「深度學習」（Deep Learning, DL）技術大行其道，它是基於「多層」神經網絡的機器學習方法。簡單來說，一層神經組織負責處理一項任務，「多層」即是把多項任務串起來統一處理。

以「人臉識別」應用為例，系統之目的是從一張照片中識別出目標人物，整理過程中第一層任務是把相中所有物件（object）的邊界（boundary）認出；第二層把各部位的相關邊界連接起來識別人臉的部位（例子臉形、眼睛、耳朵、眼眉等）；第三層把各部位本身及與其他部位之間的特徵找出來，最後第四層把所有人臉特徵組合起來判斷相中人的身份。

透過「深度學習」，系統訓練可以一次過把四層的任務，一層接一層地同時處理，這做法可減少每一層獨立處理之後再互相連接的時候所產生之錯誤，分別包括自身及複合錯誤。「深度學習」被人工智能業界廣泛使用來研發創新的應用系統，如「實時機器翻譯」（Real-time Machine Translation），效果顯著。

深度學習助AI檢測人臉特徵，從而判斷相中人的身份。（維基百科圖片）

機器學習依靠大數據作模型培訓，因此數據質量是機器學習的關鍵問題。數據不足可以嚴重影響學習的可靠性，情況等同在統計學中數據不足會局限統計結果的覆蓋範圍，繼而系統的準確率。

事實上，這亦是學術界做科研經常碰到的瓶頸問題，原因是工商業界擁有全球九成以上的應用數據，尤其是互聯網巨擘例如騰訊、谷歌等公司，學術界能使用的少之又少。針對數據短缺問題，有人工智能科學家提出以下折衷方案：

「遷移學習」（Transfer Learning）是將一個源領域（source domain）已訓練好的模型遷移至目標領域（target domain），從而建構出另一個相應而有效的目標模型。此舉可以避免機器學習由零開始，節省大量訓練數據的需求。以自然語言處理應用為例，既然系統已學會處理西班牙語，便可以把技術遷移至學習意大利語。又例如機器人經培訓後學會踏雙輪單車，它便很容易去學會駕駛電單車。
「聯邦學習」（Federated Learning）促進數據共享，各領域都擁有自己專有數據的電腦節點，透過分布式互相學習，可以強化各自的人工智能。由於各節點的數據格式不一致，難以集中管理，有見及此，近期科學家積極研究利用基於去中心化原理的「區塊鏈」技術，進行高效分布式學習。

科研偏重商業弊多於利

在數碼經濟社會中，「數據是王者」（Data is King），可是這現象引發「富者愈富，窮者愈窮」的馬太效應。大型跨國企業會利用自己的「大數據」推陳出新，研發出創新的人工智能產品，而中小型企業及學術界因數據不足，在發展速度上望塵莫及。若然情況沒法改善，全球的科研便會偏重於商業應用，而忽略基礎科學，長遠而言對未來人文發展弊多於利。

工商業界擁有全球九成以上的應用數據，學術界能使用的少之又少。（法新社資料圖片）

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI Deep Learning Machine Learning

Tweet

Pin It

Related Posts

OpenAI天下｜傳明年推AI代理Operator

OpenAI天下｜傳明年推AI代理Operator

阿里AI搜尋引擎｜對話式搜尋器協助歐美B2B採購

阿里AI搜尋引擎｜對話式搜尋器協助歐美B2B採購

輝達軟銀｜戶外試驗AI及5G網絡

輝達軟銀｜戶外試驗AI及5G網絡

速成外科醫生？｜機械人睇片數天學懂做手術

速成外科醫生？｜機械人睇片數天學懂做手術

Latest News

打入美國市場｜「小馬智行」美國上市估值最多349億
內地自動駕駛初創企業小馬智行(Pony.ai)展開在美國招股上市流程，估值最多為44.8億美元(約349.44億港元)。

Posted November 15, 2024

0

新發明｜加國新塗層防血栓減病人併發症風險
當人體血液流經導管、支架或其他醫療設備時，往往存在形成血栓風險，血塊可能會阻塞設備、擾亂治療，或導致中風和心臟病等嚴重併發症。為防止這種情況發生，醫生經常使用薄血藥，以防止病人血液凝固。

Posted November 15, 2024

0

Pokémon GO盛事駕臨香江（林國誠）
香港作為盛事之都，12月將有一項全球Pokémon GO手遊迷都關注的活動「City Safari」駕臨香江，勢必令Pokémon GO手遊再度成為全城追捧的遊戲。

Posted November 15, 2024

0

科技與權力交織須制衡防亂象（黃岳永）
美國大選塵埃落定，特朗普（Donald Trump）成為第47屆美國總統。選舉當夜，馬斯克（Elon Musk）在他的X（前稱Twitter）平台上，發布了一張他走入美國總統橢圓形辦公室的合成照，這令外界愈加關注他對特朗普的影響力，並質疑是否存在利益衝突。

Posted November 15, 2024

0

Apple被告｜iCloud在英國捱告倘敗訴恐賠295億
英國消費者權益組織「Which?」最近根據《消費者權利法》，向蘋果公司（Apple Inc.）發起集體訴訟，指控其雲端儲存服務iCloud「鎖定」當地約4000萬的消費者，iOS用戶不但難以替代儲存供應商，亦不允許儲存或備份所有資料。

Posted November 15, 2024

0

OpenAI天下｜傳明年推AI代理Operator
ChatGPT開發商OpenAI據報將在明年1月，發布一款人工智能（AI）代理工具。當中透過公司的應用程式介面，為開發人員自動執行多個步驟。

Posted November 15, 2024

0

潮玩音樂！｜智能哨子令手機變流動樂器
意大利科技初創ARTinoise推出智能哨子Zefiro，可以把智能手機、平板電腦或個人電腦，隨時變身為流動數碼樂器，輕鬆演奏、錄製及分享音樂。

Posted November 15, 2024

0

EJ Tech Video

POPULAR POSTS

The Z Label｜Z世代重視品牌背後理念

 可拉伸屏幕｜南韓首創彈性顯示器拉扯萬次畫質不變

 AI調查｜全球36%上班族辦公用AI不讓上司知悉憂被標籤懶惰

 人類直覺判斷難被AI淘汰（車品覺）

AI大戰｜百度發布大模型應用文心iRAG及無代碼工具秒噠

 速成外科醫生？｜機械人睇片數天學懂做手術

 AI趨勢｜輝達與軟銀試行全球首個AI和5G電訊網絡

 AI之戰｜印尼GoTo與騰訊、阿里達協議開發雲基礎設施

 百度AI｜百度發布AI編程文生圖多項應用

 科技園助企業出海培育未來獨角獸

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

數據為王 決定人工智能 (黃錦輝)

「深度學習」技術應用廣泛

科研偏重商業 弊多於利

更多黃錦輝文章：

支持EJ Tech

Related Posts

Latest News

EJ Tech Video

POPULAR POSTS

成為 EJ Tech 會員

數據為王決定人工智能 (黃錦輝)

科研偏重商業弊多於利