Don't Miss

浸大兩款AI模型｜AI生成動作及角色具備Sora與CG優勢

By 信報財經新聞 on March 15, 2024

原文刊於信報財經新聞「EJ Tech 創科鬥室」

美企OpenAI發布短片生成模型Sora後，隨即令科技及影視界驚艷。本地擁有電影學院的香港浸會大學，亦於香港國際影視展發布最新研究成果，重點介紹功能跟Sora類似的動作生成模型MotionGPT，以及虛擬化身模型BuVatar。領導研發的浸大計算機科學系助理教授陳杰提到，若把上述兩款模型結合使用，就像同時具備Sora及傳統動畫製作的優勢。

陳杰 BuVatar — 陳杰即場舉高雙手，示範虛擬化身模型BuVatar。（周泳彤攝）

MotionGPT及BuVatar配搭使用

陳杰指出，傳統動畫電影兼顧每項細節，卻要動用大量動畫師；現時大熱的Sora模型，可根據指令生成連貫影片，惟較難精準編輯內容。至於MotionGPT及BuVatar，使用上可謂相輔相成。MotionGPT專注動作生成，BuVatar可用於創作虛擬角色。以前者驅動後者，或能為影視業及相關學系學生，提供一種低預算的製片解決方案。

採拉班舞譜助LLM理解

人類運動時姿勢極為複雜，陳杰表示，這正是MotionGPT採用「拉班舞譜」（Labanotation）這一動作統計方式的原因。「拉班舞譜」歷史悠久，當中涉及解剖學、數學及力學等多種科學理論知識，用符號精確記錄人體的運動姿態、空間關係、動作節奏，甚至所用力量。

陳杰續解釋，把動作編排成符號，相當於字典的一個個字詞，大型語言模型（LLM）可透過這本「字典」，理解用戶想生成的動作。此外，MotionGPT亦能分析用戶所提供的音樂，讓三維模型隨意發揮（Freestyle）一段風格相近的舞蹈。

MotionGPT Labanotation — MotionGPT採用「拉班舞譜」統計方式，讓LLM理解用戶想生成的動作。（周泳彤攝）

至於BuVatar的亮點，在於透過自然語言及視覺引導（Visual Prompts），例如提供一張類似效果的相片。可為MotionGPT生成的粗糙模型，添上生動細緻的外觀。陳杰又說，傳統電腦圖學三維模型，採用光線追蹤方式，透過模擬光線在真實場景的折射、反射等生成模型，過程繁瑣且耗費大量算力資源。

頭髮衣物處理勝電腦繪圖

BuVatar基於擴散渲染引擎，不僅能根據用戶需求，穩定地生成高精度模型，其頭髮、衣物褶皺等處理能力，亦遠勝傳統電腦繪圖。談及兩款模型研發成本，陳杰透露人力資源佔比最多。一個模型大約要兩位博士學生，投入4年時間方能完成；團隊近期亦成立初創「影蹤藝術科技」，希望方案獲業界採用。

採訪、撰文：周泳彤

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI BuVatar feature HKBU MotionGPT Sora

Tweet

Pin It

Related Posts

捍衞和平先要慎選資訊（黃岳永）

捍衞和平先要慎選資訊（黃岳永）

AI手機必更強大（林國誠）

AI手機必更強大（林國誠）

AI測政見｜AI辨識人臉準確測出政見

AI測政見｜AI辨識人臉準確測出政見

無人車比賽｜阿聯酋首屆F1無人車大賽明開鑼

無人車比賽｜阿聯酋首屆F1無人車大賽明開鑼

Latest News

海外電子錢包｜Alipay+：港商戶本月起可接受14個海外電子錢包支付
螞蟻國際旗下跨境移動支付解決方案Alipay+宣布，超過13萬香港商戶本月起可接受14個熱門海外電子錢包支付，覆蓋本港90%以上的本地商戶網絡。

Posted April 26, 2024

0

中美矛盾｜據報：字節跳動寧願關閉TikTok在美業務也不願出售
路透引述4名消息人士報道，如果字節跳動用盡所有法律手段，亦無法阻止美國禁止TikTok應用程式在美國應用商店上架的法案，字節跳動寧願關閉TikTok，亦不願意出售。字節跳動拒絕評論有關報道。

Posted April 26, 2024

0

捍衞和平先要慎選資訊（黃岳永）
中立、客觀一直被視為新聞的核心理念，惟現實中，愈能煽動情緒的報道，就愈會在社交媒體上廣泛傳播。現今真正做到客觀的媒體也愈來愈少。有學生問我，想要對新聞有正確認知，從而培養自己的批判思維，但到底如何才能找到「真實」的新聞，避免產生偏見？

Posted April 26, 2024

0

AI手機必更強大（林國誠）
人工智能（AI）逐漸融入我們的日常生活當中，而手機則成為這個趨勢的核心。從拍照演算法到錄音自動生成記事，再到實時翻譯，這些功能不僅讓手機更加「智能」，也令人們的生活更添便利。

Posted April 26, 2024

0

AI測政見｜AI辨識人臉準確測出政見
美國史丹福大學商學院最近有一項研究，利用常見的人臉辨識演算法VGGFace2，將之與人工智能（AI）技術結合，透過簡單觀察一個人空白、毫無表情的臉孔，即使剔除身份、年齡、性別、種族等因素，仍能準確評估其個人政治取向，認為臉部輪廓能塑造心理特徵。

Posted April 26, 2024

0

無人車比賽｜阿聯酋首屆F1無人車大賽明開鑼
中東阿聯酋明天舉辦首屆「阿布扎比自動駕駛賽車聯賽」（A2RL）。參賽隊伍只能利用編碼技能、人工智能（AI）演算法、機器學習軟件等專業知識，指導一級方程式賽車（Formula One）在亞斯碼頭賽道（Yas Marina Circuit）行駛，爭奪225萬美元（約1755萬港元）獎金。

Posted April 26, 2024

0

醜果翻身｜港企回收醜果減碳排研冷凍術製果乾
Not Only Powder聯合創辦人指，全球近五成新鮮蔬果被糟蹋，在各類食物之中最浪費。該公司利用凍乾技術，把回收的醜陋水果回收後製成果乾、即沖粉末等產品，可保留水果超過九成維他命，有助補充人體一天所需。

Posted April 26, 2024

0

EJ Tech Video

POPULAR POSTS

南韓揭新型詐騙手法｜黑客鑽蘋果提貨漏洞行騙主謀疑身處內地？

華為獨食中國市場？｜iPhone 首季銷量跌19%華為反增69.1%

AI 砌圖｜Photoshop AI升級生成影像可微調

 foodpanda｜賴偉昕：正面競爭推動行業進步 foodpanda數據分析回應市場變化分析點餐喜好按區變陣

 香港資訊及通訊科技獎｜HKICT Awards今起接受報名今年增最佳AI應用獎

 軟銀將開發日語AI模型｜投資76億港元提升生成式AI算力

 4.22走塑｜紙飲管VS塑膠飲管？紙飲管好易淋？「走塑」解決方法是什麼？

醜果翻身｜港企回收醜果減碳排研冷凍術製果乾

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

浸大兩款AI模型｜AI生成動作及角色 具備Sora與CG優勢

MotionGPT及BuVatar配搭使用

採拉班舞譜助LLM理解

頭髮衣物處理勝電腦繪圖

支持EJ Tech

Related Posts

Latest News

EJ Tech Video

POPULAR POSTS

成為 EJ Tech 會員

浸大兩款AI模型｜AI生成動作及角色具備Sora與CG優勢