Don't Miss

人工合成數據利弊 (鄧淑明博士)

By 信報財經新聞 on December 13, 2022

本文作者鄧淑明博士，為香港大學工程學院計算機科學系、社會科學學院地理系及建築學院客席教授，為《信報》撰寫專欄「科網人語」。

人工智能（AI）的智慧來自海量數據，而今天很多地方都收緊保護私隱政策，故此，不會違反個人私隱條例的人工合成數據（Synthetic Data）應運而生。有人估計它的成本僅為真實數據的1%，自然吸引企業參與。

不單如此，真實數據可能無法反映實況，如不同種族、國籍比例，而合成版本則可減少偏差。另一方面，合成數據也可就罕見情況提供更多樣的數據，彌補難以從現實獲得這些資訊的問題。

合成數據可以是文本、媒體（片段、圖像、聲音）和列表。根據真實資料的含量，大致分為三類：一）真假各半，二）模擬真實並加以改動，三）完全虛構。

時至今日，從銀行、醫藥到無人駕駛等多個行業也有使用合成數據。據報美國運通兩年前已開始測試以深偽技術（Deepfake）片段和虛假數據如信用卡交易，提升AI演算法辨識詐騙行為的能力。摩根大通除了用合成數據來反洗黑錢外，也以此開發創新產品和服務，尤其真實的歷史數據未必可滿足需要，合成數據則能大派用場。

在醫療領域，瑞士藥廠羅氏（Roche）與初創合作，在臨床研究中使用合成醫學數據，代替患者數據，以提高分析能力。德國的夏里特醫學院醫學人工智能實驗室（CLAIM）研究中風，指每個患者的大腦結構都有其獨特之處，匿名化圖像意義不大，因此致力開發合成數據。

過去兩年來，Alphabet旗下的自動駕駛公司Waymo團隊一直以合成數據，生成逼真的駕駛數據集，包括繁忙的城市街道、高速多車的道路和混亂的停車場，或者通過調節迎面而至的車輛速度，來衡量Waymo的反應。

業內人士指出，合成數據較適合用於相對直接的問題，如欺詐檢測或信用評分，不過一旦遇上複雜多變的情況，它就應付不來。《經濟學人》舉例，以往購買單程機票，會被自動檢測模型視為欺詐的明顯預測指標，但在新冠疫情下，很多客人無奈下都會被迫這樣做；又如人臉識別，當戴口罩成為常態時，便難以發揮功效。

在需要精準真實的數據作規劃時，合成數據亦可能礙事。美國每年一度向1%的人口發出社區調查（ACS），以研究該國在教育、健康、收入、人口統計和地區之間的關係，當局打算把實際數據換成合成版本，便被批評難以為貧困小區分配本來有限的資源。

合成數據還是個新興產業，有賴不同行業和初創共同探索它的潛力。

（編者按：鄧淑明博士最新著作《你未來就緒嗎？》現已發售）

歡迎訂購：實體書、電子書

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

Tweet

Pin It

Latest News

巴黎奧運｜阿里雲利用AI技術為體育盛事歷史時刻添色彩
奧運開幕在即，阿里巴巴集團在巴黎舉行了短片《永不失色的她》（To the Greatness of HER）的首映禮，展示自19世紀末以來性別平等的發展歷程。

Posted July 26, 2024

0

固網寬頻新標準F5G-A（林國誠）
流動通訊網絡由最初2G直至現時的5G，一說起大家都知這裏的G就是指Generation，代表了第幾代流動通訊網絡，最新標準有5.5G（又稱5G-Advanced）。可是，就固網寬頻而言，香港從來沒有一個統一標準，所以不同互聯網服務供應商提供的體驗均有參差。

Posted July 26, 2024

0

CrowdStrike事件的警示（黃岳永）
2024年7月19日無聲無息隨機爆發─網絡安全巨頭CrowdStrike的一次例行更新，意外導致全球數以百萬計的Windows電腦出現「藍屏死機」。

Posted July 26, 2024

0

新護膚產品｜新防曬乳抗紫外線強三成
美國西北大學兩位科學家德拉維（Leila Deravi）及馬丁（Camille Martin），她們配製出一種新護膚成份Xanthochrome，標榜為全球首款以章魚為靈感的防曬乳。

Posted July 26, 2024

0

政府新部門｜數字辦成立提升政府效率
創新科技及工業局轄下的數字政策辦公室（數字辦）昨天正式成立，旨在合併原來的政府資訊科技總監辦公室（資科辦）及效率促進辦公室（效率辦），以加快數字政府建設。

Posted July 26, 2024

0

fb吸客｜二十歲慶生五大變革吸年輕客
社交媒體Facebook（fb）今年面世20周年，似乎漸被年輕一代冷落。fb昨天舉辦亞太傳媒簡報會「The Future of Facebook」，該公司總監艾利森（Tom Alison）在席上表示，旗下核心產品將會「重大升級」，為下代社媒消費者做好準備。

Posted July 26, 2024

0

AI個別定價？｜美國八企業 AI追蹤消費行為個別定價
美國聯邦貿易委員會（FTC）周二（23日）向8間公司發出命令，指他們利用人工智能（AI）及演算法，追蹤消費者特徵及行為，例如位置、人口統計、信用紀錄、瀏覽或購物歷史等資訊，為商品設定個人化價格。

Posted July 26, 2024

0

EJ Tech Video

POPULAR POSTS

Mobile.Cards｜CRM系統紓餐飲人手荒落單訂位儲分包辦精準營銷

 數字王國｜進駐科學園建研發中心攻AI特效

 北上消費懶人包｜跨境出行、交通、娛樂一網打盡！

俄烏戰爭｜中港據報是向俄羅斯轉運貨物中心包括晶片和半導體產品

AI之戰｜輝達傳為中國市場開發新型旗艦AI晶片

 科大新學部｜培育藝術科技人結合機器創造力擔當領導角色

 Apple 未來預測？｜傳iPhone 17 主打超薄機身

 AI之戰｜Meta推新一代Llama AI模型可與ChatGPT一爭高下

 多食生果！｜每天吃三份水果長者抑鬱風險減

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

人工合成數據利弊 (鄧淑明博士)

更多鄧淑明文章：

支持EJ Tech

Latest News

EJ Tech Video

POPULAR POSTS

成為 EJ Tech 會員