Don't Miss

理解4V特性共同點 (車品覺)

By 信報財經新聞 on October 11, 2023

本文作者車品覺，為香港科技園有限公司董事、香港大學中國商學院客座副教授，為《信報》撰寫專欄「全民大數據」。

過去10年間，大數據的發展深深地影響大型AI（人工智能）模型（如深度學習和機器學習模型）的進步及應用。隨着大數據的普及與可訪問性增加，大規模模型訓練呼之欲出。雲計算及先進的數據分析技術，使我們能夠處理和分析之前無法處理的非結構化數據（例如文章、影像等），從而訓練出更複雜的模型，如BERT和GPT-4等大規模語言模型的應用。

然而，筆者覺得大數據和大型語言模型（LLM）之間存在許多相似性，值得用家們參考，這些共通點可以通過大數據的「4V」特性來理解：Volume（體量）、Velocity（速度）、Variety（多樣性）和Veracity（真實性）。

車品覺認為，大數據和大型語言模型（LLM）之間存在許多相似性。（Freepik網上圖片）

一、體量：大數據和LLM都需要處理大量數據。處理這些數據的成本包括硬體、軟件、人力等資源。同時，數據的保護和私隱也是重要成本。當然更值得我們深思的是，往後走下去，數據量真是愈多愈好嗎？還是會出現飽和現象？

二、速度：在大數據和LLM中，處理速度至為重要。大數據需要快速捕獲、儲存、處理和分析，而LLM需要快速處理和理解輸入的文本數據，以滿足用戶的實時需求，但追求速度的背後，當然是高昂成本及投資回報。

三、多樣性：大數據和LLM都要處理多種來源的數據。處理和分析不同類型數據，可以讓我們從多個角度理解一個問題，從而獲得更全面的洞察。那麼大模型是否會像大數據一樣，需要有很多小模型作為交接點，從而產出價值？

四、真實性：大數據的價值和LLM的表現，很大程度上取決於數據的質量。但因多源異構的關係，數據質量是無法像小數據作清洗及驗證，因此在使用時都要格外小心及作多方驗證，甚至僅可以作為大方向指引，或者與傳統分析一併使用。

當處理大數據和LLM時，還需要考慮數據的私隱和安全問題。對於大數據，監管主要關注是如何收集、儲存和使用數據，以及如何保護數據的安全和私隱。對於LLM，雖然亦需要保護訓練數據的私隱，但更重要的是，如何確保模型生成的文本不會洩露敏感訊息。

毋庸置疑，LLM具有巨大的潛力，可以提高生產力，甚至幫助獲取新的知識和技能。我們需要在創意與效率之間找到平衡，筆者建議企業或個人在使用GPT類似的產品時，最好先從自己熟悉的範疇開始，學習如何與人工智能合作，最好預設它不一定會給你最準確的答案，而是提供較有創意但又模糊（Probabilistic）的建議供參考。

（編者按：車品覺著作《覺悟．大數據》現已發售）

歡迎訂購：實體書、電子書

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

LLM 大數據

Tweet

Pin It

Related Posts

Gen AI｜生成式AI可應對威脅有助把網安管理提速九成

Gen AI｜生成式AI可應對威脅有助把網安管理提速九成

Grok開源｜馬斯克xAI大模型參數量全球最大

Grok開源｜馬斯克xAI大模型參數量全球最大

OpenAI新政策宣言武器化惹擔憂

OpenAI新政策宣言武器化惹擔憂

AI大模型搞不懂SEC文件 GPT-4閉卷試九成錯 Llama 2僅19%準

AI大模型搞不懂SEC文件 GPT-4閉卷試九成錯 Llama 2僅19%準

Latest News

海外電子錢包｜Alipay+：港商戶本月起可接受14個海外電子錢包支付
螞蟻國際旗下跨境移動支付解決方案Alipay+宣布，超過13萬香港商戶本月起可接受14個熱門海外電子錢包支付，覆蓋本港90%以上的本地商戶網絡。

Posted April 26, 2024

0

中美矛盾｜據報：字節跳動寧願關閉TikTok在美業務也不願出售
路透引述4名消息人士報道，如果字節跳動用盡所有法律手段，亦無法阻止美國禁止TikTok應用程式在美國應用商店上架的法案，字節跳動寧願關閉TikTok，亦不願意出售。字節跳動拒絕評論有關報道。

Posted April 26, 2024

0

捍衞和平先要慎選資訊（黃岳永）
中立、客觀一直被視為新聞的核心理念，惟現實中，愈能煽動情緒的報道，就愈會在社交媒體上廣泛傳播。現今真正做到客觀的媒體也愈來愈少。有學生問我，想要對新聞有正確認知，從而培養自己的批判思維，但到底如何才能找到「真實」的新聞，避免產生偏見？

Posted April 26, 2024

0

AI手機必更強大（林國誠）
人工智能（AI）逐漸融入我們的日常生活當中，而手機則成為這個趨勢的核心。從拍照演算法到錄音自動生成記事，再到實時翻譯，這些功能不僅讓手機更加「智能」，也令人們的生活更添便利。

Posted April 26, 2024

0

AI測政見｜AI辨識人臉準確測出政見
美國史丹福大學商學院最近有一項研究，利用常見的人臉辨識演算法VGGFace2，將之與人工智能（AI）技術結合，透過簡單觀察一個人空白、毫無表情的臉孔，即使剔除身份、年齡、性別、種族等因素，仍能準確評估其個人政治取向，認為臉部輪廓能塑造心理特徵。

Posted April 26, 2024

0

無人車比賽｜阿聯酋首屆F1無人車大賽明開鑼
中東阿聯酋明天舉辦首屆「阿布扎比自動駕駛賽車聯賽」（A2RL）。參賽隊伍只能利用編碼技能、人工智能（AI）演算法、機器學習軟件等專業知識，指導一級方程式賽車（Formula One）在亞斯碼頭賽道（Yas Marina Circuit）行駛，爭奪225萬美元（約1755萬港元）獎金。

Posted April 26, 2024

0

醜果翻身｜港企回收醜果減碳排研冷凍術製果乾
Not Only Powder聯合創辦人指，全球近五成新鮮蔬果被糟蹋，在各類食物之中最浪費。該公司利用凍乾技術，把回收的醜陋水果回收後製成果乾、即沖粉末等產品，可保留水果超過九成維他命，有助補充人體一天所需。

Posted April 26, 2024

0

EJ Tech Video

POPULAR POSTS

南韓揭新型詐騙手法｜黑客鑽蘋果提貨漏洞行騙主謀疑身處內地？

華為獨食中國市場？｜iPhone 首季銷量跌19%華為反增69.1%

AI 砌圖｜Photoshop AI升級生成影像可微調

 foodpanda｜賴偉昕：正面競爭推動行業進步 foodpanda數據分析回應市場變化分析點餐喜好按區變陣

 香港資訊及通訊科技獎｜HKICT Awards今起接受報名今年增最佳AI應用獎

 軟銀將開發日語AI模型｜投資76億港元提升生成式AI算力

 4.22走塑｜紙飲管VS塑膠飲管？紙飲管好易淋？「走塑」解決方法是什麼？

北上消費住宿app｜3款住宿app推薦攜程、去哪兒哪個好？內有淘寶訂酒店詳盡教學！

醜果翻身｜港企回收醜果減碳排研冷凍術製果乾

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

理解4V特性共同點 (車品覺)

更多車品覺文章：

支持EJ Tech

Related Posts

Latest News

EJ Tech Video

POPULAR POSTS

成為 EJ Tech 會員