Don't Miss

AI引領多媒體創作新力量 (林國誠)

By 信報財經新聞 on July 14, 2023

本文作者林國誠，為香港電訊個人業務行政總裁，為《信報》撰寫專欄「五次元」。

近期在社交媒體出現大量由人工智能（AI）生成的作品，包括把經典電影截圖透過AI把畫面拉闊，利用音色替換程式模擬歌手聲音的翻唱歌曲，甚至以深偽技術（Deepfake）輕易地把圖像或影片「移花接木」，同時亦能生成語音內容。儘管這些生成內容多數以搞笑為主，但不能忽視AI已廣泛應用在傳統的影音媒體上，對圖像及影音處理的貢獻，超乎讀者過去對修圖及修片的認知。

AI已廣泛應用在傳統的影音媒體上，對圖像及影音處理的貢獻，超乎讀者過去對修圖及修片的認知。（路透資料圖片）

以「拉闊」經典電影截圖為例，按過往做法，首先要思考圖片以外的背景是什麼，找相關素材，利用修圖工具提供的功能慢慢地逐部分加插背景，繼而調色，使之與原來的畫面融合，就算是有經驗的高手，都需要數小時才能完成。現在有了生成式人工智能（Generative AI），運用修圖工具的生成式填充功能，在圖片中畫出要修改的部分並輸入文字指令，修圖軟件便會自動按要求製作，還有多個款式選擇；使用延伸影像可選取一部分現有圖像，讓AI參考來作延伸，令效果更完美。

AI能提供極速修圖，與AI生成模型有莫大關係，透過學習大量的圖像資料，然後利用這些資料來生成新的圖像。用家只須提供一張基本圖片作為藍本，AI就能把圖片中的物件移形換影，例如把樹林變成沙漠，又或者創造出美麗的風景照。AI圖像生成優點是速度快，通常不用1分鐘即弄妥，憑空生成或移除物件亦可一鍵完成。

AI圖像生成優點是速度快，通常不用1分鐘即弄妥，憑空生成或移除物件亦可一鍵完成。（法新社資料圖片）

此外，AI透過音色替換程式，亦可模擬歌手聲音翻唱歌曲，但並非簡單輸入指令便可，背後須經過大量處理。簡單來說，首先找出你想模擬的歌手聲音作為訓練數據，使用神經網絡對AI訓練，最後通過使用Sovits替換人聲進行生成。同時，於後期處理中，要加入一些該歌手的獨特元素，例如獨特情感和唱歌風格，方能模擬歌手聲音翻唱歌曲。

這些以AI創造的「好聲音」，除可應用在翻唱歌曲外，筆者預期未來會有歌曲以AI生成，甚至有AI歌手的出現，好處是AI可根據需要修改和調整，後期處理較有彈性，製作成本會比現時低。

另一方面，讀者也不能忽視AI生成影片，現在已有大量工具協助製作。與AI生成圖片一樣，選好影片模板及使用時輸入文字指令，便能一鍵讓AI生成整條影片，想影片更貼近現實，還可自己預備影片供訓練AI之用。不過，AI生成影片目前仍處於初步階段，當訓練模型愈來愈豐富，產生專業級影片指日可待。

有了出神入化的AI功能，只要懂得輸入指令，任何人都是修圖大師。不論是DALL．E、Midjourney、Stable Diffusion或Adobe Firefly等AI工具的製作成本均甚低，可以無限次修改作品，不用受氣。誠然，不斷學習及嘗試仍是十分重要的。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

Adobe Firefly AI Deepfake Generative AI Midjourney

Tweet

Pin It

Related Posts

明日黃花的Siri與AI手機革命（黃岳永）

明日黃花的Siri與AI手機革命（黃岳永）

AI趨勢｜LinkedIn創辦人AI分身聆聽動作多

AI趨勢｜LinkedIn創辦人AI分身聆聽動作多

首屆AI選美大賽意義非凡（葉文瀚博士）

首屆AI選美大賽意義非凡（葉文瀚博士）

AI形成新數碼鴻溝（車品覺）

AI形成新數碼鴻溝（車品覺）

Latest News

非法盒子的風險（林國誠）
坊間有不少非法的機頂盒聲稱可以讓用家免費收看不同地區的電視節目、電影及足球賽事直播，但這類機頂盒提供的內容未經授權，它們更可能帶來安全風險和網絡保安問題。

Posted May 3, 2024

0

明日黃花的Siri與AI手機革命（黃岳永）
現時每人至少一部智能手機，應該沒有多少人記得PDA（Personal Digital Assistant），更多人認識的名字應該是Palm Pilot，這種自帶手寫筆且布滿大號按鈕的掌上電腦，在十多年前這種電腦可是不少商務人士的最愛。

Posted May 3, 2024

0

新型電池｜固態電池薄如紙 1分鐘叉爆
瑞士蘇黎世聯邦理工學院（ETH Zürich）旗下初創BTRY，利用半導體生產的特殊塗層技術，開發一種超快充電的固態電池，理論上一分鐘充電100%，並能承受劇烈溫度變化，聲稱使用壽命多一般電池約10倍。

Posted May 3, 2024

0

AI之戰｜Microsoft 泰國建數據中心
微軟行政總裁納德拉（Satya Nadella）近日出訪東南亞三國，周三（5月1日）在曼谷會晤泰國總理色他（Srettha Thavisin），透露會在當地建設第一座數據中心，為超過10萬人裝備人工智能（AI）技能，當中包括培訓旅遊及酒店行業人才。

Posted May 3, 2024

0

AI趨勢｜LinkedIn創辦人AI分身聆聽動作多
職場社交平台領英（LinkedIn）聯合創辦人霍夫曼（Reid Hoffman），最近接受人工智能（AI）虛擬分身視像訪問。他在網誌提到，AI分身如就一面鏡子，有助他換位思考。

Posted May 3, 2024

0

澳拓商用量子電腦支援醫療運輸行業
澳洲政府宣布向美國量子電腦初創PsiQuantum投資9.4億澳元（約48億港元），構建全球首台「商用」量子電腦系統，擁有100萬個物理量子位元（Qubit），預計2027年底投入營運。

Posted May 3, 2024

0

無人機推薦2024｜DJI大疆並非一家獨大？Autel Robotics是有力競爭者
無人機品牌中，最出名的當屬大疆（DJI），但除了DJI大疆以外，還有什麼「勢均力敵」的選擇呢？香港旅遊發展局此前宣布，五月起舉行煙火及無人機表演，無人機話題再次受到本港市民關注。香港無人機相關規定相對嚴格，對放飛地點、時間等都有詳細規定。今日就讓小編為你介紹4款無人機，分別來自DJI大疆及Autel Robotics。

Posted May 2, 2024

0

EJ Tech Video

POPULAR POSTS

港大初創LPC｜3D建築繪圖技術結合AI提升消防安全

 智能手機之戰｜Samsung 首季營業利潤飆9.3倍料生成式AI需求續強勁

 小米進軍電動車市場｜雷軍：汽車蝕錢程度算中等偏少

 AI測天氣｜華為雲夥香港天文台天氣預報增至15天

 本地創科動態｜科大5億「紅鳥基金」撐初創冀組20億風投專攻深科技

 生物塑膠半年降解｜美國研生物複合塑膠嵌入細菌孢子遇堆肥激活分化快速降解

 澳拓商用量子電腦支援醫療運輸行業

 全球最快CPU｜阿里雲倚天710晶片跑贏亞馬遜微軟谷歌

 首屆AI選美大賽意義非凡（葉文瀚博士）

Google裁員｜解僱數百核心員工部分職位轉至印度、墨西哥

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

AI引領多媒體創作新力量 (林國誠)

更多林國誠文章：

支持EJ Tech

Related Posts

Latest News

EJ Tech Video

POPULAR POSTS

成為 EJ Tech 會員