You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

系統能自學新潮語 擬拓韓印文

By on August 16, 2021

原文刊於信報財經新聞「StartupBeat創科鬥室

何偉揚稱,廣東話被視為最難學的語言之一,故有意向難度挑戰。(黃潤根攝)

何偉揚稱,廣東話被視為最難學的語言之一,故有意向難度挑戰。(黃潤根攝)

本港AI初創Fasta.ai與香港浸會大學傳理學院,於2019年起共同進行有關中文「自然語言處理」(NLP)研究,作為開發社交分析平台Lenx.ai的基礎。平台至今分析超過100萬個廣東話詞彙,亦具備自學語言能力,能自學及理解廣東話潮語(slang),如「壞咗嘅人」、「佛系」等,未來有意開拓更多語言分析,如韓文、印地語。

夥浸大探索中文NLP

Lenx.ai去年9月推出,系統可理解廣東話語意,並按品牌關聯度(Relevancy)及情感(Sentiment)排序分析,過濾網絡留言,助企業了解時下熱話及趨勢。

Fasta.ai聯合創辦人何偉揚(Sam)稱,廣東話被視為最難學的語言之一,故有意向難度挑戰,自2019年起與浸大合作研究中文NLP技術。他指出,每學習一種新語言,需要先認識生字及句子等,AI亦如是。至今該系統已學習超過100萬詞彙,並會繼續自學新潮語。

本港AI初創Fasta.ai團隊約有13人,不乏數據科學家、數據工程師、AI專才等。(受訪者提供圖片)

本港AI初創Fasta.ai團隊約有13人,不乏數據科學家、數據工程師、AI專才等。(受訪者提供圖片)

「鑑於我們所開發的AI引擎,懂得自學語言,做好廣東話分析之後,可延伸至其他語言分析,如韓文、印地語等。」該公司未來有意繼續深化中文NLP技術,甚至分析同一詞語,在不同年份或月份,會否帶有不同意思。

每年擲數百萬元研發

被問及創建平台最大困難是什麼?何偉揚坦言,開發新平台技術約需4至6個月時間,背後如何平衡研發及應用絕不容易。除了花時間做研究,更重要的是,怎樣實踐至商業應用層面。

目前公司團隊約有13人,當中不乏數據科學家、數據工程師、AI專才等,每年用於研發(R&D)的開支達數百萬港元。何偉揚補充,未來有意在亞洲設立研發中心(R&D Hub),冀把有關AI引擎拓展至海外市場,如馬來西亞、新加坡、歐洲等地。

延伸閱讀:

AI分析網上留言 助公關及時拆彈 懂廣東話語意 兼顧情感因素

支持EJ Tech



如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們