You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

從對抗到共生?探討傳媒與AI的另一種可能性

By on July 15, 2024

去年12月,美國媒體《紐約時報》首次對OpenAI及微軟(Microsoft)提起訴訟,指控對方擅用該報數百萬篇受版權保護的文章。人工智能(AI)技術一日千里,惟這場涉資數十億美元的風波至今未有定論。而就在近日,AI智能摘要平台Arbor卻宣布與《紐約時報》及本地財經媒體《信報財經新聞》達成合作協議,推出「頂尖媒體套餐」。

AI智能摘要平台Arbor宣布與《紐約時報》及本地財經媒體《信報財經新聞》達成合作協議,推出「頂尖媒體套餐」。(Arbor網上圖片)

「頂尖媒體套餐」叫價每年998港元,即平均每月83港元。訂閱者可透過Arbor應用程式(App)、《信報》網站及app,瀏覽全部《信報》付費內容。至於《紐約時報》內容,則可在其網站及app內閱讀。

傳媒科企合作存爭議

傳媒行業跟AI科企之間向來存在張力,科技樂觀派主張AI潮流勢不可擋,傳統主義者堅持文字不容待價而沽。以美國新聞集團(News Corporation)為例,該企於五月與OpenAI達成「多年全球合作夥伴關係」協議,授權對方獲取旗下《華爾街日報》等知名報刊內容。屆時OpenAI可透過這些新聞內容訓練聊天機械人ChatGPT,增強產品能力。

作為大眾眼中的「保守派」,《紐約時報》似乎不應跟AI科企扯上關係。而我們或可藉是次合作,探討傳媒跟科企之間,究竟以何種方式合作為宜——這個無論學界業界都未有定論的課題。

智能提煉新聞精華

有別於藉文字內容提升聊天機械人回答質素,Arbor的最大賣點是資訊匯總和智慧摘要,適合萬事求快的港人。Arbor機器學習副總裁徐顯芹(Ken)接受訪問時介紹,一單新聞往往得到多間傳媒報導,內容卻大同小異。

Arbor某程度上能「集百家之大成」,把描述同一事件的冗長新聞歸納為三句話。亦能在茫茫「詞海」中提煉文章重點,並為每個重點提供三句話的總結。最後再附上消息來源連結,方便讀者閱讀原文。

談及互聯網上資訊量,Ken笑稱「個數字都幾令人震驚」。其數據量「有175皆位元組(ZB),而1ZB已經等同於1萬億吉位元組(GB),其實是一個大到常人難以想像的數字。」在此情況下,Arbor無法做到事無鉅細。因此,對於被提及次數較多的新聞事件,背後算法才會將其定義為高價值內容,並進行歸納總結。

新推影片總結功能

抖音等短視頻平台風頭正盛,顯示大眾需求日漸趨向簡明扼要。Arbor近日推出影片摘要功能,用戶只需輸入Youtube影片連結,便能快速獲取片中重點資訊。

Ken坦言,總結影片跟總結文字相比難得多。以人訪為例,影片通常夾雜很多跟重點無關的內容,對最終結果而言是一種「噪音」(Noise)。相反以文字呈現的訪談內容,往往一語中的、足夠精準。

Arbor機器學習副總裁Ken指,文字在經AI歸納總結後,還會交由團隊自研的幻覺檢測模型檢驗。

自研模型確保精準

新聞報導最重要的是公正性、真實性及可靠性。而Arbor在提煉精華的過程中,如何避免出現事實錯誤,團隊面臨的一大挑戰。Ken指,文字在經AI歸納總結後,還會交由團隊自研的幻覺檢測模型(Hallucination detection model)檢驗。

Ken進一步解釋,「所謂的幻覺,專業術語是actual inconsistency(事實不一致)⋯我們團隊(還為此)建立了自己的數據集,簡單來說就是當中有一半的總結是正確的,另一半是錯誤的⋯基於這個數據集,我們訓練了一個(幻覺檢測)模型。」

保證了準確性,下一步就是客製化。Arbor順勢推出「Newspresso」,為讀者提供客製化的新聞洞見。用戶可透過10個問題,讓Arbor了解自己的閱讀興趣。Ken笑言,「看足球都有不同角色,一個普通球迷,或者一個職業賭徒,從他們的角度看同一篇新聞,(期望獲知的)洞見都有不同。」

Arbor為一個英國註冊的創新AI資訊平台,推出約三個月便錄得超過10萬用戶。回顧整個研發過程,Ken坦言碰上不少難題。如何處理海量數據、如何不斷升級模型算法等,這些都是團隊為了「升呢」而打過的「怪獸」。Ken表示,如何精準地將新聞洞見推送給對應的讀者,是「目前市面上尚未解決、而Arbor正在努力克服」的難題之一。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們