You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

本地創科動態|理大以NSP增強訓練 AI語言模型更人性化

By on May 28, 2024

原文刊於信報財經新聞「EJ Tech 創科鬥室

香港理工大學人文學院院長李平領導團隊在最新一項研究發現,若以人類處理語言的近似方式,來訓練大型語言模型(LLM),其理解語言的表現更像人類腦部,這對腦科學研究及人工智能(AI)模型開發帶來啟發。研究刊登在國際科學期刊Science Advances

李平領導的研究團隊,將「下一句子預測」納入模型預訓練。(理大提供圖片)

對比腦部數據多處一致

李平團隊把模擬人腦評估句子連貫性的「下一句子預測」(NSP)納入模型預訓練。團隊同時訓練了兩個模型,一個具有NSP增強功能,另一個沒有。其後,邀請慣用右手、以英語為母語的人類測試者,在fMRI(功能磁共振成像)下閱讀文字,再與AI模型提取的表徵做對比。結果顯示,NSP增強模型與腦數據,在多個腦區顯示出更多一致之處。同時,LLM納入NSP的優勢,即基於增強模型的「模型—大腦對應」分數,有望更準確預測人類閱讀速度。李平提到,像NSP多樣化的學習任務,可改進LLM人性化水準,使它更接近人類智慧。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們